Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Skill-it! A data-driven skills framework for understanding and training language models
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-008-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-008-alpha.b-cdn.net
      • sl-yoda-v2-stream-008-beta.b-cdn.net
      • 1159783934.rsc.cdn77.org
      • 1511376917.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Skill-it! A data-driven skills framework for understanding and training language models
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Skill-it! A data-driven skills framework for understanding and training language models

            10. prosince 2023

            Řečníci

            MFC

            Mayee F. Chen

            Řečník · 0 sledujících

            NR

            Nicholas Roberts

            Řečník · 1 sledující

            KB

            Kush Bhatia

            Řečník · 0 sledujících

            O prezentaci

            The quality of training data impacts the performance of pre-trained large language models (LMs). Given a fixed budget of tokens, it is unclear what data to best select for the model’s performance across tasks. To study this, we develop a new framework based on a simple hypothesis: similar to how humans acquire interdependent skills in a deliberate order, there exists a natural order in how the LM best learns a set of skills from its training data. If such order exists, it can be exploited for im…

            Organizátor

            N2
            N2

            NeurIPS 2023

            Účet · 646 sledujících

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Guiding Large Language Models via Directional Stimulus Prompting
            04:59

            Guiding Large Language Models via Directional Stimulus Prompting

            Zekun Li, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Divergence at the Interpolation Threshold: Identifying, Interpreting & Ablating the Sources of a Deep Learning Puzzle
            05:07

            Divergence at the Interpolation Threshold: Identifying, Interpreting & Ablating the Sources of a Deep Learning Puzzle

            Rylan Schaeffer, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            SmoothHess: ReLU Network Feature Interactions via Stein's Lemma
            05:04

            SmoothHess: ReLU Network Feature Interactions via Stein's Lemma

            Max Torop, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Datasets and Benchmarks for Nanophotonic Structure and Parametric Design Simulations
            04:55

            Datasets and Benchmarks for Nanophotonic Structure and Parametric Design Simulations

            Jungtaek Kim, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            MiliPoint: A Point Cloud Dataset for mmWave Radar
            03:46

            MiliPoint: A Point Cloud Dataset for mmWave Radar

            Han Cui, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Round Table
            46:14

            Round Table

            Donato Crisostomi, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2023