Mingqi Yuan, Bo Li, Xin Jin, Wenjun Zeng · Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning · SlidesLive

Categories

EN

Log in Talk to sales

Next

Livestream will start soon!

Livestream has already ended.

Presentation has not been recorded yet!

SlidesLive

title: Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning

0:00 / 0:00

Report Issue
Settings
Playlists
Bookmarks
Subtitles Off
Playback rate
Quality

Settings
Debug information
Server sl-yoda-v2-stream-008-alpha.b-cdn.net
Subtitles size Medium

Bookmarks

Server
sl-yoda-v2-stream-008-alpha.b-cdn.net
sl-yoda-v2-stream-008-beta.b-cdn.net
1159783934.rsc.cdn77.org
1511376917.rsc.cdn77.org

Subtitles
Off
English

Playback rate

Quality

Subtitles size
Large
Medium
Small

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning

Rewarding Episodic Visitation Discrepancy for Exploration in Reinforcement Learning

Dec 2, 2022

Speakers

Mingqi Yuan

Speaker · 0 followers

Bo Li

Speaker · 0 followers

Xin Jin

Speaker · 0 followers

About

Exploration is critical for deep reinforcement learning in complex environments with high-dimensional observations and sparse rewards. To address this problem, recent approaches proposed to leverage intrinsic rewards to improve exploration, such as novelty-based exploration and prediction-based exploration. However, many intrinsic reward modules require sophisticated structures and representation learning, resulting in prohibitive computational complexity and unstable performance. In this paper,…

Organizer

NeurIPS 2022

Account · 961 followers

Like the format? Trust SlidesLive to capture your next event!

Professional recording and live streaming, delivered globally.

Sharing

Recommended Videos

Presentations on similar topic, category or speaker

Mitigating Health Data Poverty: Generative Approaches versus Resampling for Time-series Clinical Data

01:54

Mitigating Health Data Poverty: Generative Approaches versus Resampling for Time-series Clinical Data

Watch later

Favorite

Raffaele Marchesi, …

NeurIPS 2022 2 years ago

AntiFaceGAN: Animatable 3D-Aware Face Image Generation for Realistic Video Avatars

01:03

AntiFaceGAN: Animatable 3D-Aware Face Image Generation for Realistic Video Avatars

Watch later

Favorite

NeurIPS 2022 2 years ago

Welcome and Introduction

04:51

Welcome and Introduction

Watch later

Favorite

NeurIPS 2022 2 years ago

From Gradient Flow on Population Loss to Learning with Stochastic Gradient Descent

05:05

From Gradient Flow on Population Loss to Learning with Stochastic Gradient Descent

Watch later

Favorite

Ayush Sekhari, …

NeurIPS 2022 2 years ago

Towards Efficient 3D Object Detection with Knowledge Distillation

05:45

Towards Efficient 3D Object Detection with Knowledge Distillation

Watch later

Favorite

Jihan Yang, …

NeurIPS 2022 2 years ago

BLaDE: Robust Exploration via Diffusion Models

05:37

BLaDE: Robust Exploration via Diffusion Models

Watch later

Favorite

Zhaohan Daniel Guo, …

NeurIPS 2022 2 years ago