Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: RORL: Robust Offline Reinforcement Learning via Conservative Smoothing
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-006-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-006-alpha.b-cdn.net
      • sl-yoda-v2-stream-006-beta.b-cdn.net
      • 1549480416.rsc.cdn77.org
      • 1102696603.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            RORL: Robust Offline Reinforcement Learning via Conservative Smoothing
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            RORL: Robust Offline Reinforcement Learning via Conservative Smoothing

            28. listopadu 2022

            Řečníci

            RY

            Rui Yang

            Řečník · 0 sledujících

            CB

            Chenjia Bai

            Řečník · 0 sledujících

            XM

            Xiaoteng Ma

            Řečník · 0 sledujících

            O prezentaci

            Offline reinforcement learning (RL) provides a promising direction to exploit the massive amount of offline data for complex decision-making tasks. Due to the distribution shift issue, current offline RL algorithms are generally designed to be conservative for value estimation and action selection. However, such conservatism impairs the robustness of learned policies, leading to a significant change even for a small perturbation on observations. To trade off robustness and conservatism, we propo…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 960 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Protein Structure and Sequence Generation with Equivariant Denoising Diffusion Probabilistic Models
            13:25

            Protein Structure and Sequence Generation with Equivariant Denoising Diffusion Probabilistic Models

            Namrata Anand, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Improving Policy Learning via Language Dynamics Distillation
            04:10

            Improving Policy Learning via Language Dynamics Distillation

            Victor Zhong, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Imperceptible Adversarial Attacks on Discrete-Time Dynamic Graph Models
            09:35

            Imperceptible Adversarial Attacks on Discrete-Time Dynamic Graph Models

            Kartik Sharma, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Hindsight Divergence Minimization
            04:58

            Hindsight Divergence Minimization

            Lunjun Zhang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Universality of Group Convolutional Neural Networks Based on Ridgelet Analysis on Groups
            03:18

            Universality of Group Convolutional Neural Networks Based on Ridgelet Analysis on Groups

            Sho Sonoda, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Embed and Emulate: Learning to estimate parameters of dynamical systems with uncertainty quantification
            05:08

            Embed and Emulate: Learning to estimate parameters of dynamical systems with uncertainty quantification

            Ruoxi Jiang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022