Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Analyzing the Sensitivity to Policy-Value Decoupling in Deep Reinforcement Learning Generalization
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-006-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-006-alpha.b-cdn.net
      • sl-yoda-v2-stream-006-beta.b-cdn.net
      • 1549480416.rsc.cdn77.org
      • 1102696603.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Analyzing the Sensitivity to Policy-Value Decoupling in Deep Reinforcement Learning Generalization
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Analyzing the Sensitivity to Policy-Value Decoupling in Deep Reinforcement Learning Generalization

            2. prosince 2022

            Řečníci

            NMN

            Nasik Muhammad Nafi

            Sprecher:in · 0 Follower:innen

            RFA

            Raja Farrukh Ali

            Sprecher:in · 0 Follower:innen

            WH

            William Hsu

            Sprecher:in · 0 Follower:innen

            O prezentaci

            Existence of policy-value representation asymmetry negatively affects the generalization capability of the traditional actor-critic architecture that uses a shared representation of policy and value. Fully separated networks for policy and value avoid overfitting by addressing this representation asymmetry. However, two separate networks introduce high computational overhead. Previous work has also shown that partial separation can achieve the same level of generalization in most tasks while red…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Konto · 961 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            One-Inlier is First: Towards Efficient Position Encoding for Point Cloud Registration
            04:21

            One-Inlier is First: Towards Efficient Position Encoding for Point Cloud Registration

            Fan Yang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Anonymized Histograms in Intermediate Privacy Models
            05:04

            Anonymized Histograms in Intermediate Privacy Models

            Badih Ghazi, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Fast Instrument Learning with Faster Rates
            04:34

            Fast Instrument Learning with Faster Rates

            Ziyu Wang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular data
            05:04

            Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular data

            Nabeel Seedat, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Surrogate Modeling for Methane Dispersion Simulations Using Fourier Neural Operator
            05:03

            Surrogate Modeling for Methane Dispersion Simulations Using Fourier Neural Operator

            Qie Zhang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Provable NN Repair for Global Robustness
            07:03

            Provable NN Repair for Global Robustness

            Feisi Fu, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022