Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: In-context Reinforcement Learning with Algorithm Distillation
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-005-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-005-alpha.b-cdn.net
      • sl-yoda-v2-stream-005-beta.b-cdn.net
      • 1034628162.rsc.cdn77.org
      • 1409346856.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            In-context Reinforcement Learning with Algorithm Distillation
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            In-context Reinforcement Learning with Algorithm Distillation

            2. prosince 2022

            Řečníci

            ML

            Michael Laskin

            Řečník · 0 sledujících

            LW

            Luyu Wang

            Řečník · 0 sledujících

            JO

            Junhyuk Oh

            Řečník · 0 sledujících

            O prezentaci

            We propose Algorithm Distillation (AD), a method for distilling reinforcement learning (RL) algorithms into neural networks by modeling their training histories with a causal sequence model. Algorithm Distillation treats learning to reinforcement learn as an across-episode sequential prediction problem. A dataset of learning histories is generated by a source RL algorithm, and then a causal transformer is trained by autoregressively predicting actions given their preceding learning histories as…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 962 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            On Sample Optimality in Personalized Collaborative and Federated Learning
            04:44

            On Sample Optimality in Personalized Collaborative and Federated Learning

            Mathieu Even, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Concept-based Understanding of Emergent Multi-Agent Behavior
            05:13

            Concept-based Understanding of Emergent Multi-Agent Behavior

            Niko Grupen, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples
            01:03

            Effective Backdoor Defense by Exploiting Sensitivity of Poisoned Samples

            Weixin Chen, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Inception Transformer
            04:55

            Inception Transformer

            Chenyang Si, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Wasserstein Iterative Networks for Barycenter Estimation
            04:51

            Wasserstein Iterative Networks for Barycenter Estimation

            Alexander Korotin, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models
            05:02

            WinoGAViL: Gamified Association Benchmark to Challenge Vision-and-Language Models

            Yonatan Bitton, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022