Josiah Coad, James Ault, Jeff Hykin, Guni Sharon · A Framework for Predictable Actor-Critic Control · SlidesLive

Kategorie

CS

Přihlásit se Kontaktujte nás

Další

Živý přenos začne již brzy!

Živý přenos již skončil.

Prezentace ještě nebyla nahrána!

SlidesLive

title: A Framework for Predictable Actor-Critic Control

0:00 / 0:00

Nahlásit chybu
Nastavení
Playlisty
Záložky
Titulky Off
Rychlost přehrávání
Kvalita

Nastavení
Debug informace
Server sl-yoda-v2-stream-001-alpha.b-cdn.net
Velikost titulků Střední

Záložky

Server
sl-yoda-v2-stream-001-alpha.b-cdn.net
sl-yoda-v2-stream-001-beta.b-cdn.net
1824830694.rsc.cdn77.org
1979322955.rsc.cdn77.org

Titulky
Off
English

Rychlost přehrávání

Kvalita

Velikost titulků
Velké
Střední
Malé

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

A Framework for Predictable Actor-Critic Control

A Framework for Predictable Actor-Critic Control

2. prosince 2022

Řečníci

Josiah Coad

Řečník · 0 sledujících

James Ault

Řečník · 0 sledujících

Jeff Hykin

Řečník · 0 sledujících

O prezentaci

Reinforcement learning (RL) algorithms commonly provide a one-action plan per time step. Doing this allows the RL agent to quickly adapt and respond to stochastic environments yet it restricts the ability to predict the agent's future behavior. This paper proposes an actor-critic framework that predicts and follows an n-step plan. Committing to the next n actions presents a trade-off between behavior predictability and reduced performance. In order to balance this trade-off, a dynamic plan-follo…

Organizátor

NeurIPS 2022

Účet · 962 sledujících

Baví vás formát? Nechte SlidesLive zachytit svou akci!

Profesionální natáčení a streamování po celém světě.

Sdílení

Doporučená videa

Prezentace na podobné téma, kategorii nebo přednášejícího

Meta-Adaptive Stock Movement Prediction with Two-Stage Representation Learning

05:53

Meta-Adaptive Stock Movement Prediction with Two-Stage Representation Learning

Zhlédnout později

Oblíbené

Donglin Zhan, …

NeurIPS 2022 2 years ago

List-decodable Mean Estimation via Difference of Pairs

04:30

List-decodable Mean Estimation via Difference of Pairs

Zhlédnout později

Oblíbené

Ilias Diakonikolas, …

NeurIPS 2022 2 years ago

Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning

03:03

Visual Backtracking Teleoperation: A Data Collection Protocol for Offline Image-Based Reinforcement Learning

Zhlédnout později

Oblíbené

David Brandfonbrener, …

NeurIPS 2022 2 years ago

Provably Efficient Model-Free Constrained Reinforcement Learning Algorithm with Linear Function Approximation

05:02

Provably Efficient Model-Free Constrained Reinforcement Learning Algorithm with Linear Function Approximation

Zhlédnout později

Oblíbené

Xingyu Zhou, …

NeurIPS 2022 2 years ago

Composition Theorems for Interactive Differential Privacy

01:00

Composition Theorems for Interactive Differential Privacy

Zhlédnout později

Oblíbené

NeurIPS 2022 2 years ago

Panel Discussion: Deep Reinforcement Learning Workshop

56:02

Panel Discussion: Deep Reinforcement Learning Workshop

Zhlédnout později

Oblíbené

Stephanie Chan, …

NeurIPS 2022 2 years ago