Qiuhao Wang, Chin Pang Ho, Marek Petrik · Policy Gradient in Robust MDPs with Global Convergence Guarantee · SlidesLive

Kategorie

CS

Přihlásit se Kontaktujte nás

Další

Živý přenos začne již brzy!

Živý přenos již skončil.

Prezentace ještě nebyla nahrána!

SlidesLive

title: Policy Gradient in Robust MDPs with Global Convergence Guarantee

0:00 / 0:00

Nahlásit chybu
Nastavení
Playlisty
Záložky
Titulky Off
Rychlost přehrávání
Kvalita

Nastavení
Debug informace
Server sl-yoda-v2-stream-006-alpha.b-cdn.net
Velikost titulků Střední

Záložky

Server
sl-yoda-v2-stream-006-alpha.b-cdn.net
sl-yoda-v2-stream-006-beta.b-cdn.net
1549480416.rsc.cdn77.org
1102696603.rsc.cdn77.org

Titulky
Off
English

Rychlost přehrávání

Kvalita

Velikost titulků
Velké
Střední
Malé

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Policy Gradient in Robust MDPs with Global Convergence Guarantee

Policy Gradient in Robust MDPs with Global Convergence Guarantee

24. července 2023

Řečníci

Qiuhao Wang

Řečník · 0 sledujících

Chin Pang Ho

Řečník · 0 sledujících

Marek Petrik

Řečník · 0 sledujících

O prezentaci

Robust Markov decision processes (RMDPs) represent a promising framework for computing reliable policies in the face of model errors. Many successful reinforcement learning algorithms build on variations of policy-gradient methods, but adapting these methods to RMDPs has been challenging. As a result, the applicability of RMDPs to large, practical domains remains limited. This paper proposes a new Double-Loop Robust Policy Gradient (DRPG), the first generic policy gradient method for RMDPs. In c…

Organizátor

ICML 2023

Účet · 657 sledujících

Baví vás formát? Nechte SlidesLive zachytit svou akci!

Profesionální natáčení a streamování po celém světě.

Sdílení

Doporučená videa

Prezentace na podobné téma, kategorii nebo přednášejícího

ICML Business Meeting - all attendees

38:44

ICML Business Meeting - all attendees

Zhlédnout později

Oblíbené

Andreas Krause, …

ICML 2023 2 years ago

Deep Graph Representation Learning and Optimization for Influence Maximization

05:22

Deep Graph Representation Learning and Optimization for Influence Maximization

Zhlédnout později

Oblíbené

ICML 2023 2 years ago

Synthetic Data for Model Selection

05:16

Synthetic Data for Model Selection

Zhlédnout později

Oblíbené

Alon Shoshan, …

ICML 2023 2 years ago

Representations and Exploration for Deep RL using Singular Value Decomposition

05:26

Representations and Exploration for Deep RL using Singular Value Decomposition

Zhlédnout později

Oblíbené

Yash Chandak, …

ICML 2023 2 years ago

Probabilistic Concept Bottleneck Models

04:59

Probabilistic Concept Bottleneck Models

Zhlédnout později

Oblíbené

ICML 2023 2 years ago

Generalization Theory for Robot Learning

39:05

Generalization Theory for Robot Learning

Zhlédnout později

Oblíbené

Anirudha Majumdar

ICML 2023 2 years ago