Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Distributional deep Q-learning with CVaR regression
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-009-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-009-alpha.b-cdn.net
      • sl-yoda-v2-stream-009-beta.b-cdn.net
      • 1766500541.rsc.cdn77.org
      • 1441886916.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Distributional deep Q-learning with CVaR regression
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Distributional deep Q-learning with CVaR regression

            2. prosince 2022

            Řečníci

            MA

            Mastane Achab

            Řečník · 0 sledujících

            RA

            Reda Alami

            Řečník · 0 sledujících

            YADD

            Yasser Abdelaziz Dahou Djilali

            Řečník · 0 sledujících

            O prezentaci

            Reinforcement learning (RL) allows an agent interacting sequentially with an environment to maximize its long-term return, in expectation. In distributional RL (DRL), the agent is also interested in the probability distribution of the return, not just its expected value. This so-called distributional perspective of RL has led to new algorithms with improved empirical performance. In this paper, we recall the atomic DRL (ADRL) framework based on atomic distributions projected via the Wasserstein-…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Účet · 962 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Truncated Emphatic Temporal Difference Methods for Prediction and Control
            05:01

            Truncated Emphatic Temporal Difference Methods for Prediction and Control

            Shangtong Zhang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Deconfounded Representation Similarity for Comparison of Neural Networks
            04:55

            Deconfounded Representation Similarity for Comparison of Neural Networks

            Tianyu Cui, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Conditional Progressive Generative Adversarial Network for satellite image generation
            02:01

            Conditional Progressive Generative Adversarial Network for satellite image generation

            Renato Cardoso, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Censored Quantile Regression Neural Networks for Distribution-Free Survival Analysis
            04:34

            Censored Quantile Regression Neural Networks for Distribution-Free Survival Analysis

            Tim Pearce, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            RORL: Robust Offline Reinforcement Learning via Conservative Smoothing
            04:49

            RORL: Robust Offline Reinforcement Learning via Conservative Smoothing

            Rui Yang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Recommender Forest for Efficient Retrieval
            04:37

            Recommender Forest for Efficient Retrieval

            Chao Feng, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022