Min Zhang, Hongyao Tang, Jianye Hao, Yan Zheng · Towards A Unified Policy Abstraction Theory and Representation Learning Approach in Markov Decision Processes · SlidesLive

Categories

EN

Log in Talk to sales

Next

Livestream will start soon!

Livestream has already ended.

Presentation has not been recorded yet!

SlidesLive

title: Towards A Unified Policy Abstraction Theory and Representation Learning Approach in Markov Decision Processes

0:00 / 0:00

Report Issue
Settings
Playlists
Bookmarks
Subtitles Off
Playback rate
Quality

Settings
Debug information
Server sl-yoda-v2-stream-002-alpha.b-cdn.net
Subtitles size Medium

Bookmarks

Server
sl-yoda-v2-stream-002-alpha.b-cdn.net
sl-yoda-v2-stream-002-beta.b-cdn.net
1001562353.rsc.cdn77.org
1075090661.rsc.cdn77.org

Subtitles
Off
English

Playback rate

Quality

Subtitles size
Large
Medium
Small

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Towards A Unified Policy Abstraction Theory and Representation Learning Approach in Markov Decision Processes

Towards A Unified Policy Abstraction Theory and Representation Learning Approach in Markov Decision Processes

Dec 2, 2022

Speakers

Min Zhang

Speaker · 0 followers

Hongyao Tang

Speaker · 0 followers

Jianye Hao

Speaker · 0 followers

About

Lying on the heart of intelligent decision-making systems, how policy is represented and optimized is a fundamental problem. The root challenge in this problem is the large scale and the high complexity of policy space, which exacerbates the difficulty of policy learning especially in real-world scenarios. Towards a desirable surrogate policy space, recently policy representation in a low-dimensional latent space has shown its potential in improving both the evaluation and optimization of policy…

Organizer

NeurIPS 2022

Account · 961 followers

Like the format? Trust SlidesLive to capture your next event!

Professional recording and live streaming, delivered globally.

Sharing

Recommended Videos

Presentations on similar topic, category or speaker

Riemannian Score-Based Generative Modeling

05:14

Riemannian Score-Based Generative Modeling

Watch later

Favorite

Valentin De Bortoli, …

NeurIPS 2022 2 years ago

When Combinatorial Thompson Sampling meets Approximation Regret

05:02

When Combinatorial Thompson Sampling meets Approximation Regret

Watch later

Favorite

Pierre Perrault

NeurIPS 2022 2 years ago

MaskPlace: Fast Chip Placement via Reinforced Visual Representation Learning

01:04

MaskPlace: Fast Chip Placement via Reinforced Visual Representation Learning

Watch later

Favorite

NeurIPS 2022 2 years ago

Learning Discrete Directed Acyclic Graphs via Backpropagation

13:46

Learning Discrete Directed Acyclic Graphs via Backpropagation

Watch later

Favorite

Andrew Wren, …

NeurIPS 2022 2 years ago

Do Residual Neural Networks discretize Neural Ordinary Differential Equations?

04:54

Do Residual Neural Networks discretize Neural Ordinary Differential Equations?

Watch later

Favorite

Michael E. Sander, …

NeurIPS 2022 2 years ago

Group Meritocratic Fairness in Linear Contextual Bandits

05:57

Group Meritocratic Fairness in Linear Contextual Bandits

Watch later

Favorite

Riccardo Grazzi, …

NeurIPS 2022 2 years ago