Zhendong Wang, Jonathan J. Hunt, Mingyuan Zhou · Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning · SlidesLive

Categories

EN

Log in Talk to sales

Next

Livestream will start soon!

Livestream has already ended.

Presentation has not been recorded yet!

SlidesLive

title: Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning

0:00 / 0:00

Report Issue
Settings
Playlists
Bookmarks
Subtitles Off
Playback rate
Quality

Settings
Debug information
Server sl-yoda-v2-stream-004-alpha.b-cdn.net
Subtitles size Medium

Bookmarks

Server
sl-yoda-v2-stream-004-alpha.b-cdn.net
sl-yoda-v2-stream-004-beta.b-cdn.net
1685195716.rsc.cdn77.org
1239898752.rsc.cdn77.org

Subtitles
Off
English

Playback rate

Quality

Subtitles size
Large
Medium
Small

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning

Diffusion Policies as an Expressive Policy Class for Offline Reinforcement Learning

Dec 2, 2022

Speakers

Zhendong Wang

Speaker · 0 followers

Jonathan J. Hunt

Speaker · 0 followers

Mingyuan Zhou

Speaker · 0 followers

About

Offline reinforcement learning (RL), which aims to learn an optimal policy using a previously collected static dataset, is an important paradigm of RL. Standard RL methods often perform poorly in this regime due to the function approximation errors on out-of-distribution actions. While a variety of regularization methods have been proposed to mitigate this issue, they are often constrained by policy classes with limited expressiveness that can lead to highly suboptimal solutions. In this paper,…

Organizer

NeurIPS 2022

Account · 961 followers

Like the format? Trust SlidesLive to capture your next event!

Professional recording and live streaming, delivered globally.

Sharing

Recommended Videos

Presentations on similar topic, category or speaker

A Data-efficient Multiobjective Machine Learning Method For 3D-printed Architected Materials Design

07:47

A Data-efficient Multiobjective Machine Learning Method For 3D-printed Architected Materials Design

Watch later

Favorite

NeurIPS 2022 2 years ago

Conformal Prediction in 2022

56:41

Conformal Prediction in 2022

Watch later

Favorite

Emmanuel Candés

NeurIPS 2022 2 years ago

RTFormer: Efficient Design for Real-Time Semantic Segmentation with Transformer

01:01

RTFormer: Efficient Design for Real-Time Semantic Segmentation with Transformer

Watch later

Favorite

NeurIPS 2022 2 years ago

APG: Adaptive Parameter Generation Network for Click-Through Rate Prediction

05:16

APG: Adaptive Parameter Generation Network for Click-Through Rate Prediction

Watch later

Favorite

Bencheng Yan, …

NeurIPS 2022 2 years ago

Domain Generalization without Excess Empirical Risk

05:11

Domain Generalization without Excess Empirical Risk

Watch later

Favorite

Ozan Sener, …

NeurIPS 2022 2 years ago

Semi-analytical Industrial Cooling System Model for Reinforcement Learning

02:59

Semi-analytical Industrial Cooling System Model for Reinforcement Learning

Watch later

Favorite

Yuri Chervonyi, …

NeurIPS 2022 2 years ago