Další
Živý přenos začne již brzy!
Živý přenos již skončil.
Prezentace ještě nebyla nahrána!
  • title: Counterexample Guided RL Policy Refinement Using Bayesian Optimization
      0:00 / 0:00
      • Nahlásit chybu
      • Nastavení
      • Playlisty
      • Záložky
      • Titulky Off
      • Rychlost přehrávání
      • Kvalita
      • Nastavení
      • Debug informace
      • Server sl-yoda-v2-stream-007-alpha.b-cdn.net
      • Velikost titulků Střední
      • Záložky
      • Server
      • sl-yoda-v2-stream-007-alpha.b-cdn.net
      • sl-yoda-v2-stream-007-beta.b-cdn.net
      • 1678031076.rsc.cdn77.org
      • 1932936657.rsc.cdn77.org
      • Titulky
      • Off
      • English
      • Rychlost přehrávání
      • Kvalita
      • Velikost titulků
      • Velké
      • Střední
      • Malé
      • Mode
      • Video Slideshow
      • Audio Slideshow
      • Slideshow
      • Video
      Moje playlisty
        Záložky
          00:00:00
            Counterexample Guided RL Policy Refinement Using Bayesian Optimization
            • Nastavení
            • Sync diff
            • Kvalita
            • Nastavení
            • Server
            • Kvalita
            • Server

            Counterexample Guided RL Policy Refinement Using Bayesian Optimization

            6. prosince 2021

            Řečníci

            BG

            Briti Gangopadhyay

            Řečník · 0 sledujících

            PD

            Pallab Dasgupta

            Řečník · 0 sledujících

            O prezentaci

            Constructing Reinforcement Learning (RL) policies that adhere to safety requirements is an emerging field of study. RL agents learn via trial and error with an objective to optimize a reward signal. Often policies that are designed to accumulate rewards do not satisfy safety specifications. We present a methodology for counterexample guided refinement of a trained RL policy against a given safety specification. Our approach has two main components. The first component is an approach to discover…

            Organizátor

            N2
            N2

            NeurIPS 2021

            Účet · 1,9k sledujících

            O organizátorovi (NeurIPS 2021)

            Neural Information Processing Systems (NeurIPS) is a multi-track machine learning and computational neuroscience conference that includes invited talks, demonstrations, symposia and oral and poster presentations of refereed papers. Following the conference, there are workshops which provide a less formal setting.

            Baví vás formát? Nechte SlidesLive zachytit svou akci!

            Profesionální natáčení a streamování po celém světě.

            Sdílení

            Doporučená videa

            Prezentace na podobné téma, kategorii nebo přednášejícího

            Policy Optimization via Optimal Policy Evaluation
            04:10

            Policy Optimization via Optimal Policy Evaluation

            Alberto Maria Metelli, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Learning to Iteratively Solve Routing Problems with Dual-Aspect Collaborative Transformer
            03:25

            Learning to Iteratively Solve Routing Problems with Dual-Aspect Collaborative Transformer

            Yining Ma, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Smooth Normalizing Flows
            13:53

            Smooth Normalizing Flows

            Jonas Köhler, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Video Instance Segmentation using Inter-Frame Communication Transformers
            10:00

            Video Instance Segmentation using Inter-Frame Communication Transformers

            Sukjun Hwang, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            An Image is Worth More Than a Thousand Words: Towards Disentanglement in The Wild
            10:20

            An Image is Worth More Than a Thousand Words: Towards Disentanglement in The Wild

            Aviv Gabbay, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Learning Semantic Representations to Verify Hardware Designs
            15:50

            Learning Semantic Representations to Verify Hardware Designs

            Shobha Vasudevan, …

            N2
            N2
            NeurIPS 2021 3 years ago

            Pro uložení prezentace do věčného trezoru hlasovalo 0 diváků, což je 0.0 %

            Zajímají Vás podobná videa? Sledujte NeurIPS 2021