Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: SGD with large step sizes learns sparse features
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-005-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-005-alpha.b-cdn.net
      • sl-yoda-v2-stream-005-beta.b-cdn.net
      • 1034628162.rsc.cdn77.org
      • 1409346856.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            SGD with large step sizes learns sparse features
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            SGD with large step sizes learns sparse features

            24. července 2023

            Řečníci

            MA

            Maksym Andriushchenko

            Řečník · 0 sledujících

            AV

            Aditya Varre

            Řečník · 0 sledujících

            LP

            Loucas Pillaud-Vivien

            Řečník · 0 sledujících

            O prezentaci

            We showcase important features of the dynamics of the Stochastic Gradient Descent (SGD) in the training of neural networks. We present empirical observations that commonly used large step sizes (i) may lead the iterates to jump from one side of a valley to the other causing loss stabilization, and (ii) this stabilization induces a hidden stochastic dynamics that biases it implicitly toward simple predictors. Furthermore, we show empirically that the longer large step sizes keep SGD high in the l…

            Organizátor

            I2
            I2

            ICML 2023

            Účet · 657 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Define, Evaluate, and Improve Task-Oriented Cognitive Capabilities for Instruction Generation Models
            09:01

            Define, Evaluate, and Improve Task-Oriented Cognitive Capabilities for Instruction Generation Models

            Lingjun Zhao, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Reprogramming Pretrained Language Models for Antibody Sequence Infilling
            05:29

            Reprogramming Pretrained Language Models for Antibody Sequence Infilling

            Igor Melnyk, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Causal Bounds in Quasi-Markovian Graphs
            05:32

            Causal Bounds in Quasi-Markovian Graphs

            Madhumitha Shridharan, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            SWARM Parallelism: Training Large Models Can Be Surprisingly Communication-Efficient
            05:44

            SWARM Parallelism: Training Large Models Can Be Surprisingly Communication-Efficient

            Max Ryabinin, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Taxonomy-Structured Domain Adaptation (TSDA)
            05:05

            Taxonomy-Structured Domain Adaptation (TSDA)

            Tianyi Liu, …

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Neurosymbolic Learning as a Path to Learning with Guarantees
            25:51

            Neurosymbolic Learning as a Path to Learning with Guarantees

            Armando Solar-Lezama

            I2
            I2
            ICML 2023 2 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte ICML 2023