Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: On The Global Convergence of Reinforcement Learning Algorithms With Neural Network Parametrization
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-010-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-010-alpha.b-cdn.net
      • sl-yoda-v2-stream-010-beta.b-cdn.net
      • 1759419103.rsc.cdn77.org
      • 1016618226.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            On The Global Convergence of Reinforcement Learning Algorithms With Neural Network Parametrization
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            On The Global Convergence of Reinforcement Learning Algorithms With Neural Network Parametrization

            24. července 2023

            Řečníci

            MG

            Mudit Gaur

            Řečník · 0 sledujících

            VA

            Vaneet Aggarwal

            Řečník · 0 sledujících

            MA

            Mridul Aggarwal

            Řečník · 0 sledujících

            O prezentaci

            Deep Q-learning based algorithms have been applied successfully in many decision making problems, while their theoretical foundations are not as well understood. In this paper, we study a Fitted Q-Iteration with two-layer ReLU neural network parameterization, and find the sample complexity guarantees for the algorithm. Our approach estimates the Q-function in each iteration using a convex optimization problem. We show that this approach achieves a sample complexity of 𝒪̃(1/ϵ^2), which is order-…

            Organizátor

            I2
            I2

            ICML 2023

            Účet · 657 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            One-vs-the-Rest Loss to Focus on Important Samples in Adversarial Training
            04:37

            One-vs-the-Rest Loss to Focus on Important Samples in Adversarial Training

            Sekitoshi Kanai, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Active Ranking of Experts Based on their Performances in Many Tasks
            09:01

            Active Ranking of Experts Based on their Performances in Many Tasks

            El Mehdi Saad, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Pre-training for Speech Translation: CTC Meets Optimal Transport
            05:21

            Pre-training for Speech Translation: CTC Meets Optimal Transport

            Phuong-Hang Le, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Adaptive IMLE for Few-shot Pretraining-free Generative Modelling
            05:20

            Adaptive IMLE for Few-shot Pretraining-free Generative Modelling

            Mehran Aghabozorgi, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Training Large Language Models on Cerebras Wafer Scale Clusters
            25:52

            Training Large Language Models on Cerebras Wafer Scale Clusters

            Natalia Vassilieva

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Coarse-to-Fine: a Hierarchical Diffusion Model for Molecule Generation in 3D
            04:59

            Coarse-to-Fine: a Hierarchical Diffusion Model for Molecule Generation in 3D

            Bo Qiang, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICML 2023