Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v3-stream-013-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v3-stream-013-alpha.b-cdn.net
      • sl-yoda-v3-stream-013-beta.b-cdn.net
      • 1668715672.rsc.cdn77.org
      • 1420896597.rsc.cdn77.org
      • Titulky
      • Off
      • en
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Controlling Overestimation Bias with Truncated Mixture of Continuous Distributional Quantile Critics

            12. července 2020

            Řečníci

            AK

            Arsenii Kuznetsov

            Řečník · 0 sledujících

            PS

            Pavel Shvechikov

            Řečník · 0 sledujících

            AG

            Alexander Grishin

            Řečník · 0 sledujících

            O prezentaci

            According to previous studies, one of the major impediments to accurate off-policy learning is the overestimation bias. This paper investigates a novel way to alleviate the overestimation bias in a continuous control setting. Our method—Truncated Quantile Critics, TQC,—blends three ideas: distributional representation of a critic, truncation of critics prediction, and ensembling of multiple critics. We show that all components are key for the achieved performance. Distributional representation c…

            Organizátor

            I2
            I2

            ICML 2020

            Účet · 2,7k sledujících

            Kategorie

            Matematika

            Kategorie · 2,4k prezentací

            Umělá inteligence a data science

            Kategorie · 10,8k prezentací

            O organizátorovi (ICML 2020)

            The International Conference on Machine Learning (ICML) is the premier gathering of professionals dedicated to the advancement of the branch of artificial intelligence known as machine learning. ICML is globally renowned for presenting and publishing cutting-edge research on all aspects of machine learning used in closely related areas like artificial intelligence, statistics and data science, as well as important application areas such as machine vision, computational biology, speech recognition, and robotics. ICML is one of the fastest growing artificial intelligence conferences in the world. Participants at ICML span a wide range of backgrounds, from academic and industrial researchers, to entrepreneurs and engineers, to graduate students and postdocs.

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Multipole Graph Neural Operator for Parametric PDEs
            05:00

            Multipole Graph Neural Operator for Parametric PDEs

            Zongyi Li, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Contrastive Multi-View Representation Learning on Graphs
            09:07

            Contrastive Multi-View Representation Learning on Graphs

            Kaveh Hassani, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Collecting Empirical Data About Hyperparameters for Data Driven AutoML
            01:16

            Collecting Empirical Data About Hyperparameters for Data Driven AutoML

            Martin Binder, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Tightening Exploration in Upper Confidence Reinforcement Learning
            16:14

            Tightening Exploration in Upper Confidence Reinforcement Learning

            Hippolyte Bourel, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Near Optimal Sample Complexity Bounds for Learning Latent k-polytopes and applications to Ad-Mixtures
            15:04

            Near Optimal Sample Complexity Bounds for Learning Latent k-polytopes and applications to Ad-Mixtures

            Chiranjib Bhattacharyya, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            On Relativistic f-Divergences

            Alexia Jolicoeur-Martineau

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICML 2020