Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: A Framework for Predictable Actor-Critic Control
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-001-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-001-alpha.b-cdn.net
      • sl-yoda-v2-stream-001-beta.b-cdn.net
      • 1824830694.rsc.cdn77.org
      • 1979322955.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            A Framework for Predictable Actor-Critic Control
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            A Framework for Predictable Actor-Critic Control

            2. prosince 2022

            Řečníci

            JC

            Josiah Coad

            Řečník · 0 sledujících

            JA

            James Ault

            Řečník · 0 sledujících

            JH

            Jeff Hykin

            Řečník · 0 sledujících

            O prezentaci

            Reinforcement learning (RL) algorithms commonly provide a one-action plan per time step. Doing this allows the RL agent to quickly adapt and respond to stochastic environments yet it restricts the ability to predict the agent's future behavior. This paper proposes an actor-critic framework that predicts and follows an n-step plan. Committing to the next n actions presents a trade-off between behavior predictability and reduced performance. In order to balance this trade-off, a dynamic plan-follo…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 962 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Meta-Adaptive Stock Movement Prediction with Two-Stage Representation Learning
            05:53

            Meta-Adaptive Stock Movement Prediction with Two-Stage Representation Learning

            Donglin Zhan, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            List-decodable Mean Estimation via Difference of Pairs
            04:30

            List-decodable Mean Estimation via Difference of Pairs

            Ilias Diakonikolas, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based  Reinforcement Learning
            03:03

            Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning

            David Brandfonbrener, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Provably Efficient Model-Free Constrained Reinforcement Learning Algorithm with Linear Function Approximation
            05:02

            Provably Efficient Model-Free Constrained Reinforcement Learning Algorithm with Linear Function Approximation

            Xingyu Zhou, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Composition Theorems for Interactive Differential Privacy
            01:00

            Composition Theorems for Interactive Differential Privacy

            Xin Lyu

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Panel Discussion: Deep Reinforcement Learning Workshop
            56:02

            Panel Discussion: Deep Reinforcement Learning Workshop

            Stephanie Chan, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022