Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: The Benefits of Model-Based Generalization in Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-003-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-003-alpha.b-cdn.net
      • sl-yoda-v2-stream-003-beta.b-cdn.net
      • 1544410162.rsc.cdn77.org
      • 1005514182.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            The Benefits of Model-Based Generalization in Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            The Benefits of Model-Based Generalization in Reinforcement Learning

            2. prosince 2022

            Řečníci

            KY

            Kenny Young

            Řečník · 0 sledujících

            AR

            Aditya Ramesh

            Řečník · 1 sledující

            LK

            Louis Kirsch

            Řečník · 0 sledujících

            O prezentaci

            Model-Based Reinforcement Learning (RL) is widely believed to have the potential to improve sample efficiency by allowing an agent to synthesize large amounts of imagined experience. Experience Replay (ER) can be considered a simple kind of model, which has proved extremely effective at improving the stability and efficiency of deep RL. In principle, a learned parametric model could improve on ER by generalizing from real experience to augment the dataset with additional plausible experience. Ho…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 962 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Democratizing surcigl skills - video analysis for quantifying surgical expertise
            28:59

            Democratizing surcigl skills - video analysis for quantifying surgical expertise

            Spefanie Speidel

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            COLD Decoding: Energy-based Constrained Text Generation  with Langevin Dynamics
            05:19

            COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics

            Lianhui Qin, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Machine Learning for Climate Risk
            28:04

            Machine Learning for Climate Risk

            Bianca Zadrozny

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Accelerated Sampling and Improved Synthesis in Diffusion Models
            30:20

            Accelerated Sampling and Improved Synthesis in Diffusion Models

            Karsten Kreis

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Target alignment in truncated kernel ridge regression
            04:50

            Target alignment in truncated kernel ridge regression

            Arash Amini, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Learning Counterfactually Invariant Predictors
            03:01

            Learning Counterfactually Invariant Predictors

            Francesco Quinzan, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022