Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Anti-Exploration by Random Network Distillation
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-004-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-004-alpha.b-cdn.net
      • sl-yoda-v2-stream-004-beta.b-cdn.net
      • 1685195716.rsc.cdn77.org
      • 1239898752.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Anti-Exploration by Random Network Distillation
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Anti-Exploration by Random Network Distillation

            24. července 2023

            Řečníci

            AN

            Alexander Nikulin

            Sprecher:in · 0 Follower:innen

            VK

            Vladislav Kurenkov

            Sprecher:in · 0 Follower:innen

            DT

            Denis Tarasov

            Sprecher:in · 0 Follower:innen

            O prezentaci

            Despite the success of Random Network Distillation (RND) in various domains, it was shown as not discriminative enough to be used as an uncertainty estimator for penalizing out-of-distribution actions in offline reinforcement learning. In this paper, we revisit these results and show that, with a naive choice of conditioning for the RND prior, it becomes infeasible for the actor to effectively minimize the anti-exploration bonus and discriminativity is not an issue. We show that this limitation…

            Organizátor

            I2
            I2

            ICML 2023

            Konto · 657 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Optimal randomized multilevel Monte Carlo estimators for repeatedly nested expectations
            05:07

            Optimal randomized multilevel Monte Carlo estimators for repeatedly nested expectations

            Yasa Syed, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Latent Traversals in Generative Models as Potential Flows
            05:18

            Latent Traversals in Generative Models as Potential Flows

            Yue Song, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Finite-Sample Analysis of Learning High-Dimensional Single ReLU Neuron
            05:21

            Finite-Sample Analysis of Learning High-Dimensional Single ReLU Neuron

            Jingfeng Wu, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            BNN-DP: Robustness Certification of Bayesian Neural Networks via Dynamic Programming
            05:13

            BNN-DP: Robustness Certification of Bayesian Neural Networks via Dynamic Programming

            Steven Adams, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Diffusion Models are Minimax Optimal Distribution Estimators
            08:25

            Diffusion Models are Minimax Optimal Distribution Estimators

            Kazusato Oko, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            A closer look at few-shot classification again
            05:15

            A closer look at few-shot classification again

            Xu Luo, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte ICML 2023