Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Selectively Sharing Experiences Improves Multi-Agent Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-008-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-008-alpha.b-cdn.net
      • sl-yoda-v2-stream-008-beta.b-cdn.net
      • 1159783934.rsc.cdn77.org
      • 1511376917.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Selectively Sharing Experiences Improves Multi-Agent Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Selectively Sharing Experiences Improves Multi-Agent Reinforcement Learning

            2. prosince 2022

            Řečníci

            MG

            Matthias Gerstgrasser

            Řečník · 0 sledujících

            TD

            Tom Danino

            Řečník · 0 sledujících

            SK

            Sarah Keren

            Řečník · 0 sledujících

            O prezentaci

            We present a novel multi-agent RL approach, Selective Multi-Agent PER, in which agents share with other agents a limited number of transitions they observe during training. They follow a similar heuristic as is used in (single-agent) Prioritized Experience Replay, and choose those transitions based on their td-error. The intuition behind this is that even a small number of relevant experiences from other agents could help each agent learn. Unlike many other multi-agent RL algorithms, this approa…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 961 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Towards Understanding Grokking: An Effective Theory of Representation Learning
            04:45

            Towards Understanding Grokking: An Effective Theory of Representation Learning

            Ziming Liu, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Cicero: Training Language Models to Negotiate in the Game of Diplomacy
            47:26

            Cicero: Training Language Models to Negotiate in the Game of Diplomacy

            Mike Lewis

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Few Shot Generative Domain Adaptation Via Inference-Stage Latent Learning in GANs
            04:58

            Few Shot Generative Domain Adaptation Via Inference-Stage Latent Learning in GANs

            Arnab Kumar Mondal, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 1 diváků, což je 0.1 %

            Meta-RL for Multi-Agent RL: Learning to Adapt to Evolving Agents
            04:10

            Meta-RL for Multi-Agent RL: Learning to Adapt to Evolving Agents

            Matthias Gerstgrasser, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Block-Recurrent Transformers
            04:42

            Block-Recurrent Transformers

            DeLesley Hutchins, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Fault-Aware Neural Code Rankers
            05:08

            Fault-Aware Neural Code Rankers

            Jeevana Priya Inala, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022