Briti Gangopadhyay, Pallab Dasgupta · Counterexample Guided RL Policy Refinement Using Bayesian Optimization · SlidesLive

Kategorie

CS

Přihlásit se Kontaktujte nás

Další

Živý přenos začne již brzy!

Živý přenos již skončil.

Prezentace ještě nebyla nahrána!

SlidesLive

title: Counterexample Guided RL Policy Refinement Using Bayesian Optimization

0:00 / 0:00

Nahlásit chybu
Nastavení
Playlisty
Záložky
Titulky Off
Rychlost přehrávání
Kvalita

Nastavení
Debug informace
Server sl-yoda-v2-stream-007-alpha.b-cdn.net
Velikost titulků Střední

Záložky

Server
sl-yoda-v2-stream-007-alpha.b-cdn.net
sl-yoda-v2-stream-007-beta.b-cdn.net
1678031076.rsc.cdn77.org
1932936657.rsc.cdn77.org

Titulky
Off
English

Rychlost přehrávání

Kvalita

Velikost titulků
Velké
Střední
Malé

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Counterexample Guided RL Policy Refinement Using Bayesian Optimization

Counterexample Guided RL Policy Refinement Using Bayesian Optimization

6. prosince 2021

Řečníci

Briti Gangopadhyay

Řečník · 0 sledujících

Pallab Dasgupta

Řečník · 0 sledujících

O prezentaci

Constructing Reinforcement Learning (RL) policies that adhere to safety requirements is an emerging field of study. RL agents learn via trial and error with an objective to optimize a reward signal. Often policies that are designed to accumulate rewards do not satisfy safety specifications. We present a methodology for counterexample guided refinement of a trained RL policy against a given safety specification. Our approach has two main components. The first component is an approach to discover…

Organizátor

NeurIPS 2021

Účet · 1,9k sledujících

O organizátorovi (NeurIPS 2021)

Neural Information Processing Systems (NeurIPS) is a multi-track machine learning and computational neuroscience conference that includes invited talks, demonstrations, symposia and oral and poster presentations of refereed papers. Following the conference, there are workshops which provide a less formal setting.

Baví vás formát? Nechte SlidesLive zachytit svou akci!

Profesionální natáčení a streamování po celém světě.

Sdílení

Doporučená videa

Prezentace na podobné téma, kategorii nebo přednášejícího

Policy Optimization via Optimal Policy Evaluation

04:10

Policy Optimization via Optimal Policy Evaluation

Zhlédnout později

Oblíbené

Alberto Maria Metelli, …

NeurIPS 2021 3 years ago

Learning to Iteratively Solve Routing Problems with Dual-Aspect Collaborative Transformer

03:25

Learning to Iteratively Solve Routing Problems with Dual-Aspect Collaborative Transformer

Zhlédnout později

Oblíbené

NeurIPS 2021 3 years ago

Smooth Normalizing Flows

13:53

Smooth Normalizing Flows

Zhlédnout později

Oblíbené

Jonas Köhler, …

NeurIPS 2021 3 years ago

Video Instance Segmentation using Inter-Frame Communication Transformers

10:00

Video Instance Segmentation using Inter-Frame Communication Transformers

Zhlédnout později

Oblíbené

Sukjun Hwang, …

NeurIPS 2021 3 years ago

An Image is Worth More Than a Thousand Words: Towards Disentanglement in The Wild

10:20

An Image is Worth More Than a Thousand Words: Towards Disentanglement in The Wild

Zhlédnout později

Oblíbené

Aviv Gabbay, …

NeurIPS 2021 3 years ago

Learning Semantic Representations to Verify Hardware Designs

15:50

Learning Semantic Representations to Verify Hardware Designs

Zhlédnout později

Oblíbené

Shobha Vasudevan, …

NeurIPS 2021 3 years ago