Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Learning Intuitive Policies Using Action Features
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-005-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-005-alpha.b-cdn.net
      • sl-yoda-v2-stream-005-beta.b-cdn.net
      • 1034628162.rsc.cdn77.org
      • 1409346856.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Learning Intuitive Policies Using Action Features
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Learning Intuitive Policies Using Action Features

            24. července 2023

            Řečníci

            MM

            Mingwei Ma

            Sprecher:in · 0 Follower:innen

            JL

            Jizhou Liu

            Sprecher:in · 0 Follower:innen

            SS

            Samuel Sokota

            Sprecher:in · 0 Follower:innen

            O prezentaci

            An unaddressed challenge in multi-agent coordination is to enable AI agents to exploit the semantic relationships between the features of actions and the features of observations. Humans take advantage of these relationships in highly intuitive ways. For instance, in the absence of a shared language, we might point to the object we desire or hold up our fingers to indicate how many objects we want. To address this challenge, we investigate the effect of network architecture on the propensity of…

            Organizátor

            I2
            I2

            ICML 2023

            Konto · 657 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Poisoning Generative Replay in Continual Learning to Promote Forgetting
            04:08

            Poisoning Generative Replay in Continual Learning to Promote Forgetting

            Siteng Kang, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            GEAR: A GPU-Centric Experience Replay System for Large Reinforcement Learning Models
            04:45

            GEAR: A GPU-Centric Experience Replay System for Large Reinforcement Learning Models

            Hanjing Wang, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Polarity is all you need to learn and transfer faster
            05:16

            Polarity is all you need to learn and transfer faster

            Alice, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Self-Repellent Random Walks on General Graphs - Achieving Minimal Sampling Variance via Nonlinear Markov Chains
            04:49

            Self-Repellent Random Walks on General Graphs - Achieving Minimal Sampling Variance via Nonlinear Markov Chains

            Vishwaraj Doshi, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Lowering the Pre-training Tax for Gradient-Based Subset Training
            04:43

            Lowering the Pre-training Tax for Gradient-Based Subset Training

            Yeonju Ro, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Inverse Reinforcement Learning without Reinforcement Learning
            05:19

            Inverse Reinforcement Learning without Reinforcement Learning

            Gokul Swamy, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte ICML 2023