Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-010-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-010-alpha.b-cdn.net
      • sl-yoda-v2-stream-010-beta.b-cdn.net
      • 1759419103.rsc.cdn77.org
      • 1016618226.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning

            28. listopadu 2022

            Řečníci

            BL
            BL

            Bo Liu

            Řečník · 1 sledující

            XF

            Xidong Feng

            Řečník · 0 sledujících

            JR

            Jie Ren

            Řečník · 0 sledujících

            O prezentaci

            Gradient-based Meta-RL (GMRL) refers to methods that maintain two-level optimisation procedures wherein the outer-loop meta-learner guides the inner-loop gradient-based reinforcement learner to achieve fast adaptations. In this paper, we develop a unified framework that describes variations of GMRL algorithms and points out that existing stochastic meta-gradient estimators adopted by GMRL are actually biased. Such meta-gradient bias comes from two sources: 1) the compositional bias incurred by t…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 961 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            fficient Finetuning of Transformers for Source Code
            05:01

            fficient Finetuning of Transformers for Source Code

            Shamil Ayupov, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            PhysGNN: A Physics–Driven Graph Neural Network Based Model for Predicting Soft Tissue Deformation in Image–Guided Neurosurgery
            04:45

            PhysGNN: A Physics–Driven Graph Neural Network Based Model for Predicting Soft Tissue Deformation in Image–Guided Neurosurgery

            Yasmin Salehi, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Estimating Noise Transition Matrix with Label Correlations for Noisy Multi-Label Learning
            01:00

            Estimating Noise Transition Matrix with Label Correlations for Noisy Multi-Label Learning

            Shikun Li, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Compression supports low-dimensional representations of behavior across neural circuits
            10:40

            Compression supports low-dimensional representations of behavior across neural circuits

            Dale Zhou, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Cross-modal Learning for Image-Guided Point Cloud Shape Completion
            05:13

            Cross-modal Learning for Image-Guided Point Cloud Shape Completion

            Emanuele Aiello, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            When is the Convergence Time of Langevin Algorithms Dimension Independent? A Composite Optimization Viewpoint
            05:02

            When is the Convergence Time of Langevin Algorithms Dimension Independent? A Composite Optimization Viewpoint

            Yoav S Freund, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022