Mingqi Yuan, Bo Li, Xin Jin, Wenjun Zeng · Automatic Intrinsic Reward Shaping for Exploration in Deep Reinforcement Learning · SlidesLive

Kategorie

CS

Přihlásit se Kontaktujte nás

Další

Živý přenos začne již brzy!

Živý přenos již skončil.

Prezentace ještě nebyla nahrána!

SlidesLive

title: Automatic Intrinsic Reward Shaping for Exploration in Deep Reinforcement Learning

0:00 / 0:00

Nahlásit chybu
Nastavení
Playlisty
Záložky
Titulky Off
Rychlost přehrávání
Kvalita

Nastavení
Debug informace
Server sl-yoda-v2-stream-007-alpha.b-cdn.net
Velikost titulků Střední

Záložky

Server
sl-yoda-v2-stream-007-alpha.b-cdn.net
sl-yoda-v2-stream-007-beta.b-cdn.net
1678031076.rsc.cdn77.org
1932936657.rsc.cdn77.org

Titulky
Off
English

Rychlost přehrávání

Kvalita

Velikost titulků
Velké
Střední
Malé

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Automatic Intrinsic Reward Shaping for Exploration in Deep Reinforcement Learning

Automatic Intrinsic Reward Shaping for Exploration in Deep Reinforcement Learning

24. července 2023

Řečníci

Mingqi Yuan

Řečník · 0 sledujících

Bo Li

Řečník · 0 sledujících

Xin Jin

Řečník · 0 sledujících

O prezentaci

We present AIRS: **A**utomatic **I**ntrinsic **R**eward **S**haping that intelligently and adaptively provides high-quality intrinsic rewards to enhance exploration in reinforcement learning (RL). More specifically, AIRS selects shaping function from a predefined set based on the estimated task return in real-time, providing reliable exploration incentives and alleviating the biased objective problem. Moreover, we develop an intrinsic reward toolkit to provide efficient and reliable implementati…

Organizátor

ICML 2023

Účet · 657 sledujících

Baví vás formát? Nechte SlidesLive zachytit svou akci!

Profesionální natáčení a streamování po celém světě.

Sdílení

Doporučená videa

Prezentace na podobné téma, kategorii nebo přednášejícího

ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs

05:01

ReLOAD: Reinforcement Learning with Optimistic Ascent-Descent for Last-Iterate Convergence in Constrained MDPs

Zhlédnout později

Oblíbené

Ted Moskovitz, …

ICML 2023 2 years ago

A Connection between One-Step RL and Critic Regularization in Reinforcement Learning

05:30

A Connection between One-Step RL and Critic Regularization in Reinforcement Learning

Zhlédnout později

Oblíbené

Benjamin Eysenbach, …

ICML 2023 2 years ago

GP Priors for Systems of Linear PDE with Constant Coefficients

05:09

GP Priors for Systems of Linear PDE with Constant Coefficients

Zhlédnout později

Oblíbené

Marc Harkonen, …

ICML 2023 2 years ago

Information-Theoretic State Space Model for Multi-View Reinforcement Learning

05:11

Information-Theoretic State Space Model for Multi-View Reinforcement Learning

Zhlédnout později

Oblíbené

HyeongJoo Hwang, …

ICML 2023 2 years ago

Dynamic Constrained Submodular Optimization with Polylogarithmic Update Time

05:11

Dynamic Constrained Submodular Optimization with Polylogarithmic Update Time

Zhlédnout později

Oblíbené

Kiarash Banihashem, …

ICML 2023 2 years ago

Building Neural Networks on Matrix Manifolds: A Gyrovector Space Approach

05:16

Building Neural Networks on Matrix Manifolds: A Gyrovector Space Approach

Zhlédnout později

Oblíbené

Xuan Son Nguyen, …

ICML 2023 2 years ago