Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Ready Policy One: World Building Through Active Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v3-stream-016-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v3-stream-016-alpha.b-cdn.net
      • sl-yoda-v3-stream-016-beta.b-cdn.net
      • 1504562137.rsc.cdn77.org
      • 1896834465.rsc.cdn77.org
      • Titulky
      • Off
      • en
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Ready Policy One: World Building Through Active Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Ready Policy One: World Building Through Active Learning

            12. července 2020

            Řečníci

            JP

            Jack Parker-Holder

            Řečník · 1 sledující

            AP

            Aldo Pacchiano

            Řečník · 0 sledujících

            KC

            Krzysztof Choromanski

            Řečník · 0 sledujících

            O prezentaci

            Model-Based Reinforcement Learning (MBRL) offers a promising direction for sample efficient learning, often achieving state of the art results for continuous control tasks. However many existing MBRL methods rely on combining greedy policies with exploration heuristics, and even those which utilize principled exploration bonuses construct dual objectives in an ad hoc fashion. In this paper we introduce Ready Policy One (RP1), a framework that views MBRL as an active learning problem, where we ai…

            Organizátor

            I2
            I2

            ICML 2020

            Účet · 2,7k sledujících

            Kategorie

            Umělá inteligence a data science

            Kategorie · 10,8k prezentací

            O organizátorovi (ICML 2020)

            The International Conference on Machine Learning (ICML) is the premier gathering of professionals dedicated to the advancement of the branch of artificial intelligence known as machine learning. ICML is globally renowned for presenting and publishing cutting-edge research on all aspects of machine learning used in closely related areas like artificial intelligence, statistics and data science, as well as important application areas such as machine vision, computational biology, speech recognition, and robotics. ICML is one of the fastest growing artificial intelligence conferences in the world. Participants at ICML span a wide range of backgrounds, from academic and industrial researchers, to entrepreneurs and engineers, to graduate students and postdocs.

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            A system for crowd counting in highly congested scenes geared towards smart transportation system
            11:38

            A system for crowd counting in highly congested scenes geared towards smart transportation system

            Cecilia V. Macias Hernandez, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Machine Learning with Signal Processing - Part II: Stochastic Differential Equations
            56:46

            Machine Learning with Signal Processing - Part II: Stochastic Differential Equations

            Arno Solin

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Thompson Sampling via Local Uncertainty
            11:59

            Thompson Sampling via Local Uncertainty

            Zhendong Wang, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            SDE-Net: Equipping Deep Neural Networks with Uncertainty Estimates
            14:48

            SDE-Net: Equipping Deep Neural Networks with Uncertainty Estimates

            Lingkai Kong, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Novel Audio Embeddings for Personalized Recommendations on Newly Released Tracks
            19:00

            Novel Audio Embeddings for Personalized Recommendations on Newly Released Tracks

            Beici Liang, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation
            14:09

            Minimax-Optimal Off-Policy Evaluation with Linear Function Approximation

            Yaqi Duan, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICML 2020