Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Skill Machines: Temporal Logic Composition in Reinforcement Learning
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-001-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-001-alpha.b-cdn.net
      • sl-yoda-v2-stream-001-beta.b-cdn.net
      • 1824830694.rsc.cdn77.org
      • 1979322955.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Skill Machines: Temporal Logic Composition in Reinforcement Learning
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Skill Machines: Temporal Logic Composition in Reinforcement Learning

            2. prosince 2022

            Řečníci

            GNT

            Geraud Nangue Tasse

            Sprecher:in · 0 Follower:innen

            DJ

            Devon Jarvis

            Sprecher:in · 0 Follower:innen

            SJ

            Steven James

            Sprecher:in · 0 Follower:innen

            O prezentaci

            A major challenge in reinforcement learning is specifying tasks in a manner that is both interpretable and verifiable. One common approach is to specify tasks through reward machines—finite state machines that encode the task to be solved. We introduce skill machines, a representation that can be learned directly from these reward machines that encode the solution to such tasks. We propose a framework where an agent first learns a set of base skills in a reward-free setting, and then combines th…

            Organizátor

            N2
            N2

            NeurIPS 2022

            Konto · 962 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Self-Organized Group for Cooperative Multi-agent Reinforcement Learning
            01:02

            Self-Organized Group for Cooperative Multi-agent Reinforcement Learning

            Jianzhun Shao, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Masked inverse folding with sequence transfer for protein representation learning
            02:04

            Masked inverse folding with sequence transfer for protein representation learning

            Kevin Kaichuang Yang, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            A Benchmark for Out of Distribution Detection in Point Cloud 3D Semantic Segmentation
            02:48

            A Benchmark for Out of Distribution Detection in Point Cloud 3D Semantic Segmentation

            Lokesh Veeramacheneni, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            A Unifying Framework for Online Optimization with Long-Term Constraints
            04:52

            A Unifying Framework for Online Optimization with Long-Term Constraints

            Matteo Castiglioni, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            ALIFE: Adaptive Logit Regularizer and Feature Replay for Incremental Semantic Segmentation
            04:59

            ALIFE: Adaptive Logit Regularizer and Feature Replay for Incremental Semantic Segmentation

            Youngmin Oh, …

            N2
            N2
            NeurIPS 2022 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Retrospective Adversarial Replay for Continual Learning
            04:27

            Retrospective Adversarial Replay for Continual Learning

            Lilly Kumari, …

            N2
            N2
            NeurIPS 2022 3 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte NeurIPS 2022