Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Near-Minimax-Optimal Risk-Sensitive RL with CVaR
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-004-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-004-alpha.b-cdn.net
      • sl-yoda-v2-stream-004-beta.b-cdn.net
      • 1685195716.rsc.cdn77.org
      • 1239898752.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Near-Minimax-Optimal Risk-Sensitive RL with CVaR
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Near-Minimax-Optimal Risk-Sensitive RL with CVaR

            24. července 2023

            Řečníci

            KW

            Kaiwen Wang

            Řečník · 0 sledujících

            NK

            Nathan Kallus

            Řečník · 2 sledující

            WS

            Wen Sun

            Řečník · 0 sledujících

            O prezentaci

            In this paper, we study risk-sensitive Reinforcement Learning (RL), focusing on the objective of Conditional Value at Risk (CVaR) with risk tolerance τ. Starting with multi-arm bandits (MABs), we show the minimax CVaR regret rate is Ω(√(τ^-1AK)), where A is the number of actions and K is the number of episodes, and that it is achieved by an Upper Confidence Bound algorithm with a novel Bernstein bonus. For online RL in tabular Markov Decision Processes (MDPs), we show a minimax regret lower boun…

            Organizátor

            I2
            I2

            ICML 2023

            Účet · 657 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Extrapolated Random Tree for Regression
            04:57

            Extrapolated Random Tree for Regression

            Yuchao Cai, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Adapting to game trees in zero-sum imperfect information games
            07:43

            Adapting to game trees in zero-sum imperfect information games

            Côme Fiegel, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            On the Relationship Between Explanation and Prediction: A Causal View
            05:43

            On the Relationship Between Explanation and Prediction: A Causal View

            Amir-Hossein Karimi, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Sample Complexity Bounds for Learning High-dimensional Simplices in Noisy Regimes
            04:41

            Sample Complexity Bounds for Learning High-dimensional Simplices in Noisy Regimes

            Amir H. Saberi, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Continuation Path Learning for Homotopy Optimization
            05:12

            Continuation Path Learning for Homotopy Optimization

            Xi Lin, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Learning Preconditioner for Conjugate Gradient PDE Solver
            04:25

            Learning Preconditioner for Conjugate Gradient PDE Solver

            Yichen Li, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICML 2023