Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: FlowPG: Action-constrained Policy Gradient with Normalizing Flows
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-001-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-001-alpha.b-cdn.net
      • sl-yoda-v2-stream-001-beta.b-cdn.net
      • 1824830694.rsc.cdn77.org
      • 1979322955.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            FlowPG: Action-constrained Policy Gradient with Normalizing Flows
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            FlowPG: Action-constrained Policy Gradient with Normalizing Flows

            10. prosince 2023

            Řečníci

            JCB

            Janaka Chathuranga Brahmanage

            Sprecher:in · 0 Follower:innen

            JL

            Jiajing Ling

            Sprecher:in · 0 Follower:innen

            AK

            Akshat Kumar

            Sprecher:in · 0 Follower:innen

            O prezentaci

            Action-constrained reinforcement learning (ACRL) is a popular approach for solving safety-critical and resource-allocation related decision making problems. However, one of the major challenges in solving ACRL is to find valid actions that satisfy the constraints in each RL step. While adding a projection layer on top of the original policy network is a commonly used approach, it involves solving a mathematical program, either during training or in action execution, or both, which can result in…

            Organizátor

            N2
            N2

            NeurIPS 2023

            Konto · 648 Follower:innen

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Triple Eagle: Simple, Fast and Practical Budget-Feasible Mechanisms
            04:17

            Triple Eagle: Simple, Fast and Practical Budget-Feasible Mechanisms

            Kai Han, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            An Overview of Metrics Used for Weather Nowcasting
            19:54

            An Overview of Metrics Used for Weather Nowcasting

            Federico Serva

            N2
            N2
            NeurIPS 2023 16 months ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            High-Dimensional Asymptotics of Denoising Auto-encoders
            04:54

            High-Dimensional Asymptotics of Denoising Auto-encoders

            Hugo Cui, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            MIMEx: Intrinsic Rewards from Masked Input Modeling
            02:16

            MIMEx: Intrinsic Rewards from Masked Input Modeling

            Toru Lin, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            SuperVision: Self-Supervised Super-Resolution for Appearance-Based Gaze Estimation
            12:11

            SuperVision: Self-Supervised Super-Resolution for Appearance-Based Gaze Estimation

            Galen O'Shea, …

            N2
            N2
            NeurIPS 2023 16 months ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Interpretable Multimodal Deep Learning with Application to Brain Imaging and Genomics Data Fusion
            34:59

            Interpretable Multimodal Deep Learning with Application to Brain Imaging and Genomics Data Fusion

            Yu-Ping Wang

            N2
            N2
            NeurIPS 2023 16 months ago

            Ewigspeicher-Fortschrittswert: 0 = 0.0%

            Zajímají Vás podobná videa? Sledujte NeurIPS 2023