Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: The Emphatic Approach to Average-Reward Policy Evaluation
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-010-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-010-alpha.b-cdn.net
      • sl-yoda-v2-stream-010-beta.b-cdn.net
      • 1759419103.rsc.cdn77.org
      • 1016618226.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            The Emphatic Approach to Average-Reward Policy Evaluation
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            The Emphatic Approach to Average-Reward Policy Evaluation

            2. prosince 2022

            Řečníci

            JH

            Jiamin He

            Sprecher:in · 0 Follower:innen

            YW

            Yi Wan

            Sprecher:in · 0 Follower:innen

            RM

            Rupam Mahmood

            Sprecher:in · 0 Follower:innen

            O prezentaci

            Off-policy policy evaluation has been a longstanding problem in reinforcement learning. This paper looks at this problem under the average-reward formulation with function approximation. Differential temporal-difference (TD) learning has been proposed recently and has shown great potential compared to previous average-reward learning algorithms. In the tabular setting, off-policy differential TD is guaranteed to converge. However, the convergence guarantee cannot be carried through the function…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Konto · 961 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Discovered Policy Optimisation
            05:26

            Discovered Policy Optimisation

            Chris Lu, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Vision GNN: An Image is Worth Graph of Nodes
            07:44

            Vision GNN: An Image is Worth Graph of Nodes

            Kai Han, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 1 = 0.1%

            One Layer is All You Need
            04:25

            One Layer is All You Need

            Yue Bai, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Losses Can Be Blessings: Routing Self-Supervised Speech Representations Towards Efficient Multilingual and Multitask Speech Processing
            05:10
            Combinatorial Bandits with Linear Constraints: Beyond Knapsacks and Fairness
            05:03

            Combinatorial Bandits with Linear Constraints: Beyond Knapsacks and Fairness

            Qingsong Liu, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Accelerating Perturbed Stochastic Iterates in Asynchronous Lock-Free Optimization
            04:33

            Accelerating Perturbed Stochastic Iterates in Asynchronous Lock-Free Optimization

            Kaiwen Zhou, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022