Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: RLang: A Declarative Language for Describing Partial World Knowledge to Reinforcement Learning Agents
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-002-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-002-alpha.b-cdn.net
      • sl-yoda-v2-stream-002-beta.b-cdn.net
      • 1001562353.rsc.cdn77.org
      • 1075090661.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            RLang: A Declarative Language for Describing Partial World Knowledge to Reinforcement Learning Agents
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            RLang: A Declarative Language for Describing Partial World Knowledge to Reinforcement Learning Agents

            24. července 2023

            Řečníci

            RR

            Rafael Rodriguez-Sanchez

            Sprecher:in · 0 Follower:innen

            BAS

            Benjamin A. Spiegel

            Sprecher:in · 0 Follower:innen

            JW

            Jennifer Wang

            Sprecher:in · 0 Follower:innen

            O prezentaci

            We introduce RLang, a domain-specific language (DSL) for communicating domain knowledge to an RL agent. Unlike existing RL DSLs that ground to single elements of a decision-making formalism (e.g., the reward function or policy), RLang can specify information about every element of a Markov decision process. We define precise syntax and grounding semantics for RLang, and provide a parser that grounds RLang programs to an algorithm-agnostic partial world model and policy that can be exploited by a…

            Organizátor

            I2
            I2

            ICML 2023

            Konto · 657 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Exploring Model Dynamics for Accumulative Poisoning Discovery
            03:02

            Exploring Model Dynamics for Accumulative Poisoning Discovery

            Jianing Zhu, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Transport Variational Inference and Diffusions With Applications to Annealed Flows and Schrodinger Bridges
            15:41

            Transport Variational Inference and Diffusions With Applications to Annealed Flows and Schrodinger Bridges

            Francisco Vargas, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            How many perturbations break this model? Evaluating robustness beyond adversarial accuracy
            05:18

            How many perturbations break this model? Evaluating robustness beyond adversarial accuracy

            Raphaël Olivier, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Charting the Course: A Deep Dive into the Evolution and Future Trajectory of Multimodal AI in Radiology
            28:20

            Charting the Course: A Deep Dive into the Evolution and Future Trajectory of Multimodal AI in Radiology

            Judy Wawira

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Deployable image and video generation with distilled diffusion models
            26:01

            Deployable image and video generation with distilled diffusion models

            Tim Salimans

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Shape-Guided Dual-Memory Learning for 3D Anomaly Detection
            05:03

            Shape-Guided Dual-Memory Learning for 3D Anomaly Detection

            Yu-Min Chu, …

            I2
            I2
            ICML 2023 2 years ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte ICML 2023