Kaiwen Wang, Nathan Kallus, Wen Sun · Near-Minimax-Optimal Risk-Sensitive RL with CVaR · SlidesLive

Kategorie

CS

Přihlásit se Kontaktujte nás

Další

Živý přenos začne již brzy!

Živý přenos již skončil.

Prezentace ještě nebyla nahrána!

SlidesLive

title: Near-Minimax-Optimal Risk-Sensitive RL with CVaR

0:00 / 0:00

Nahlásit chybu
Nastavení
Playlisty
Záložky
Titulky Off
Rychlost přehrávání
Kvalita

Nastavení
Debug informace
Server sl-yoda-v2-stream-004-alpha.b-cdn.net
Velikost titulků Střední

Záložky

Server
sl-yoda-v2-stream-004-alpha.b-cdn.net
sl-yoda-v2-stream-004-beta.b-cdn.net
1685195716.rsc.cdn77.org
1239898752.rsc.cdn77.org

Titulky
Off
English

Rychlost přehrávání

Kvalita

Velikost titulků
Velké
Střední
Malé

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Near-Minimax-Optimal Risk-Sensitive RL with CVaR

Near-Minimax-Optimal Risk-Sensitive RL with CVaR

24. července 2023

Řečníci

Kaiwen Wang

Řečník · 0 sledujících

Nathan Kallus

Řečník · 2 sledující

Wen Sun

Řečník · 0 sledujících

O prezentaci

In this paper, we study risk-sensitive Reinforcement Learning (RL), focusing on the objective of Conditional Value at Risk (CVaR) with risk tolerance τ. Starting with multi-arm bandits (MABs), we show the minimax CVaR regret rate is Ω(√(τ^-1AK)), where A is the number of actions and K is the number of episodes, and that it is achieved by an Upper Confidence Bound algorithm with a novel Bernstein bonus. For online RL in tabular Markov Decision Processes (MDPs), we show a minimax regret lower boun…

Organizátor

ICML 2023

Účet · 657 sledujících

Baví vás formát? Nechte SlidesLive zachytit svou akci!

Profesionální natáčení a streamování po celém světě.

Sdílení

Doporučená videa

Prezentace na podobné téma, kategorii nebo přednášejícího

Extrapolated Random Tree for Regression

04:57

Extrapolated Random Tree for Regression

Zhlédnout později

Oblíbené

Yuchao Cai, …

ICML 2023 2 years ago

Adapting to game trees in zero-sum imperfect information games

07:43

Adapting to game trees in zero-sum imperfect information games

Zhlédnout později

Oblíbené

Côme Fiegel, …

ICML 2023 2 years ago

On the Relationship Between Explanation and Prediction: A Causal View

05:43

On the Relationship Between Explanation and Prediction: A Causal View

Zhlédnout později

Oblíbené

Amir-Hossein Karimi, …

ICML 2023 2 years ago

Sample Complexity Bounds for Learning High-dimensional Simplices in Noisy Regimes

04:41

Sample Complexity Bounds for Learning High-dimensional Simplices in Noisy Regimes

Zhlédnout později

Oblíbené

Amir H. Saberi, …

ICML 2023 2 years ago

Continuation Path Learning for Homotopy Optimization

05:12

Continuation Path Learning for Homotopy Optimization

Zhlédnout později

Oblíbené

ICML 2023 2 years ago

Learning Preconditioner for Conjugate Gradient PDE Solver

04:25

Learning Preconditioner for Conjugate Gradient PDE Solver

Zhlédnout později

Oblíbené

ICML 2023 2 years ago