Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: A Law of Iterated Logarithm for Multi-Agent Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-003-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-003-alpha.b-cdn.net
      • sl-yoda-v2-stream-003-beta.b-cdn.net
      • 1544410162.rsc.cdn77.org
      • 1005514182.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            A Law of Iterated Logarithm for Multi-Agent Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            A Law of Iterated Logarithm for Multi-Agent Reinforcement Learning

            6. prosince 2021

            Řečníci

            GT

            Gugan Thoppe

            Řečník · 0 sledujících

            BK

            Bhumesh Kumar

            Řečník · 0 sledujících

            O prezentaci

            In Multi-Agent Reinforcement Learning (MARL), multiple agents interact with a common environment and with each other, for solving a shared problem in sequential decision-making. Algorithms for MARL have a wealth of application in popular domains including gaming, robotics, and finance. In this work, we study a family of distributed nonlinear stochastic approximation schemes useful in MARL and derive a novel law of iterated logarithm. In particular, our result describes the convergence rate on al…

            Organizátor

            N2
            N2

            NeurIPS 2021

            Účet · 1,9k sledujících

            O organizátorovi (NeurIPS 2021)

            Neural Information Processing Systems (NeurIPS) is a multi-track machine learning and computational neuroscience conference that includes invited talks, demonstrations, symposia and oral and poster presentations of refereed papers. Following the conference, there are workshops which provide a less formal setting.

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Beyond Target Networks: Improving Deep Q-learning with Functional Regularization
            03:10

            Beyond Target Networks: Improving Deep Q-learning with Functional Regularization

            Alexandre Piche, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Beyond the Signs: Nonparametric Tensor Completion via Sign Series
            12:06

            Beyond the Signs: Nonparametric Tensor Completion via Sign Series

            Chanwoo Lee, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Uniform Concentration Bounds toward a Unified  Framework for Robust Clustering
            15:22

            Uniform Concentration Bounds toward a Unified Framework for Robust Clustering

            Debolina Paul, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Conditionally Parameterized, Discretization-Aware Neural Networks for Mesh-Based Modeling of Physical Systems
            09:10

            Conditionally Parameterized, Discretization-Aware Neural Networks for Mesh-Based Modeling of Physical Systems

            Jiayang Xu, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Noether Networks: Meta-Learning Useful Conserved Quantities
            11:18

            Noether Networks: Meta-Learning Useful Conserved Quantities

            Ferran Alet, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Building a New Econ Data as Capital
            50:24

            Building a New Econ Data as Capital

            Alex Pentland

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2021