Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Return-Based Contrastive Representation Learning for Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-009-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-009-alpha.b-cdn.net
      • sl-yoda-v2-stream-009-beta.b-cdn.net
      • 1766500541.rsc.cdn77.org
      • 1441886916.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Return-Based Contrastive Representation Learning for Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Return-Based Contrastive Representation Learning for Reinforcement Learning

            3. května 2021

            Řečníci

            GL

            Guoqing Liu

            Řečník · 0 sledujících

            CZ

            Chuheng Zhang

            Řečník · 0 sledujících

            LZ

            Li Zhao

            Řečník · 0 sledujících

            O prezentaci

            Recently, various auxiliary tasks have been proposed to accelerate representation learning and improve sample efficiency in deep reinforcement learning (RL). However, existing auxiliary tasks do not take the characteristics of RL problems into consideration and are unsupervised. By leveraging returns, the most important feedback signals in RL, we propose a novel auxiliary task that forces the learnt representations to discriminate state-action pairs with different returns. Our auxiliary loss is…

            Organizátor

            I2
            I2

            ICLR 2021

            Účet · 906 sledujících

            O organizátorovi (ICLR 2021)

            The International Conference on Learning Representations (ICLR) is the premier gathering of professionals dedicated to the advancement of the branch of artificial intelligence called representation learning, but generally referred to as deep learning. ICLR is globally renowned for presenting and publishing cutting-edge research on all aspects of deep learning used in the fields of artificial intelligence, statistics and data science, as well as important application areas such as machine vision, computational biology, speech recognition, text understanding, gaming, and robotics.

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Deep Partition Aggregation: Provable Defenses against General Poisoning Attacks
            05:13

            Deep Partition Aggregation: Provable Defenses against General Poisoning Attacks

            Alexander Leviné, …

            I2
            I2
            ICLR 2021 4 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            The Importance of Pessimism in Fixed-Dataset Policy Optimization
            06:54

            The Importance of Pessimism in Fixed-Dataset Policy Optimization

            Jacob Buckman, …

            I2
            I2
            ICLR 2021 4 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Neuroscience and AI/ML: Examples from studies of navigation and attention
            1:09:15

            Neuroscience and AI/ML: Examples from studies of navigation and attention

            Jack Gallant

            I2
            I2
            ICLR 2021 4 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Distributed Gaussian Differential Privacy Via Shuffling
            08:14

            Distributed Gaussian Differential Privacy Via Shuffling

            Kan Chen

            I2
            I2
            ICLR 2021 4 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Emergent Road Rules In Multi-Agent Driving Environments
            04:48

            Emergent Road Rules In Multi-Agent Driving Environments

            Avik Pal, …

            I2
            I2
            ICLR 2021 4 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            BiPointNet: Binary Neural Network for Point Clouds
            04:52

            BiPointNet: Binary Neural Network for Point Clouds

            Haotong Qin, …

            I2
            I2
            ICLR 2021 4 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICLR 2021