Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Batch Reinforcement Learning with Hyperparameter Gradients
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-010-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-010-alpha.b-cdn.net
      • sl-yoda-v2-stream-010-beta.b-cdn.net
      • 1759419103.rsc.cdn77.org
      • 1016618226.rsc.cdn77.org
      • Titulky
      • Off
      • en
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Batch Reinforcement Learning with Hyperparameter Gradients
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Batch Reinforcement Learning with Hyperparameter Gradients

            12. července 2020

            Řečníci

            BL

            Byung-Jun Lee

            Řečník · 0 sledujících

            JL

            Jongmin Lee

            Řečník · 0 sledujících

            PV

            Peter Vrancx

            Řečník · 0 sledujících

            O prezentaci

            We consider the batch reinforcement learning problem where the agent needs to learn only from a fixed batch of data, without further interaction with the environment. In such a scenario, we want to prevent the optimized policy from deviating too much from the data collection policy since the estimation becomes highly unstable otherwise due to the off-policy nature of the problem. However, imposing this requirement too strongly will result in a policy that merely follows the data collection polic…

            Organizátor

            I2
            I2

            ICML 2020

            Účet · 2,6k sledujících

            Kategorie

            Umělá inteligence a data science

            Kategorie · 10,8k prezentací

            O organizátorovi (ICML 2020)

            The International Conference on Machine Learning (ICML) is the premier gathering of professionals dedicated to the advancement of the branch of artificial intelligence known as machine learning. ICML is globally renowned for presenting and publishing cutting-edge research on all aspects of machine learning used in closely related areas like artificial intelligence, statistics and data science, as well as important application areas such as machine vision, computational biology, speech recognition, and robotics. ICML is one of the fastest growing artificial intelligence conferences in the world. Participants at ICML span a wide range of backgrounds, from academic and industrial researchers, to entrepreneurs and engineers, to graduate students and postdocs.

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            (Locally) Differentially Private Combinatorial Semi-Bandits
            12:39

            (Locally) Differentially Private Combinatorial Semi-Bandits

            Xiaoyu Chen, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            DeltaGrad: Rapid retraining of machine learning models
            14:43

            DeltaGrad: Rapid retraining of machine learning models

            Yinjun Wu, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Healthcare Systems, Population Health, and the role of health-tech
            27:04

            Healthcare Systems, Population Health, and the role of health-tech

            Trishan Panch, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Variational Autoencoders with Riemannian Brownian Motion Priors
            12:38

            Variational Autoencoders with Riemannian Brownian Motion Priors

            Dimitrios Kalatzis, …

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Machine Learning & Epidemiology
            29:28

            Machine Learning & Epidemiology

            Elaine Nsoesie

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Monte Carlo with DPPs: From random matrices to kernel quadrature
            34:48

            Monte Carlo with DPPs: From random matrices to kernel quadrature

            Rémi Bardenet

            I2
            I2
            ICML 2020 5 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICML 2020