Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: A Game-Theoretic Perspective of Generalization in Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-007-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-007-alpha.b-cdn.net
      • sl-yoda-v2-stream-007-beta.b-cdn.net
      • 1678031076.rsc.cdn77.org
      • 1932936657.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            A Game-Theoretic Perspective of Generalization in Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            A Game-Theoretic Perspective of Generalization in Reinforcement Learning

            2. prosince 2022

            Řečníci

            CY

            Chang Yang

            Sprecher:in · 0 Follower:innen

            RW

            Ruiyu Wang

            Sprecher:in · 0 Follower:innen

            XW

            Xinrun Wang

            Sprecher:in · 0 Follower:innen

            O prezentaci

            Generalization in reinforcement learning (RL) is of importance for real deployment of RL algorithms. Various schemes are proposed to address the generalization issues, including transfer learning, multi-task learning, meta learning, as well as robust and adversarial reinforcement learning. However, there is not a unified formulation of various schemes and comprehensive comparisons of methods across different schemes. In this work, we propound GiRL, a game-theoretic framework for generalization i…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Konto · 960 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Differentially Private Learning with Margin Guarantees
            25:43

            Differentially Private Learning with Margin Guarantees

            Mehryar Mohri

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Value Function Decomposition for Iterative Design of Reinforcement Learning Agents
            04:29

            Value Function Decomposition for Iterative Design of Reinforcement Learning Agents

            James MacGlashan, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Uncertainty-Aware Reinforcement Learning for Risk-Sensitive Player Evaluation in Sports Game
            04:50

            Uncertainty-Aware Reinforcement Learning for Risk-Sensitive Player Evaluation in Sports Game

            Guiliang Liu, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            On the Complexity of Adversarial Decision Making
            05:32

            On the Complexity of Adversarial Decision Making

            Ayush Sekhari, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Dynamic Sparse Network for Time Series Classification: Learning What to “See”
            05:13

            Dynamic Sparse Network for Time Series Classification: Learning What to “See”

            Qiao Xiao, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            A gradient estimator for zero-order optimization with two point feedback
            04:24

            A gradient estimator for zero-order optimization with two point feedback

            Arya Akhavan, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022