Tianhao Wang, Dongruo Zhou, Quanquan Gu · Provably Efficient Reinforcement Learning with Linear Function Approximation under Adaptivity Constraints · SlidesLive

Kategorien

DE

Anmelden Vertrieb kontaktieren

Next

Livestream will start soon!

Livestream has already ended.

Presentation has not been recorded yet!

SlidesLive

title: Provably Efficient Reinforcement Learning with Linear Function Approximation under Adaptivity Constraints

0:00 / 0:00

Report Issue
Settings
Playlists
Bookmarks
Subtitles Off
Playback rate
Quality

Settings
Debug information
Server sl-yoda-v3-stream-011-alpha.b-cdn.net
Subtitles size Medium

Bookmarks

Server
sl-yoda-v3-stream-011-alpha.b-cdn.net
sl-yoda-v3-stream-011-beta.b-cdn.net
1150868944.rsc.cdn77.org
1511650057.rsc.cdn77.org

Subtitles
Off
English

Playback rate

Quality

Subtitles size
Large
Medium
Small

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Provably Efficient Reinforcement Learning with Linear Function Approximation under Adaptivity Constraints

Provably Efficient Reinforcement Learning with Linear Function Approximation under Adaptivity Constraints

Dez 6, 2021

Sprecher:innen

Tianhao Wang

Řečník · 0 sledujících

Dongruo Zhou

Řečník · 0 sledujících

Quanquan Gu

Řečník · 5 sledujících

Über

We study reinforcement learning (RL) with linear function approximation under the adaptivity constraint. We consider two popular limited adaptivity models: the batch learning model and the rare policy switch model, and propose two efficient online RL algorithms for episodic linear Markov decision processes, where the transition probability and the reward function can be represented as a linear function of some known feature mapping. In specific, for the batch learning model, our proposed LSVI-U…

Organisator

NeurIPS 2021

Účet · 1,9k sledujících

Über NeurIPS 2021

Neural Information Processing Systems (NeurIPS) is a multi-track machine learning and computational neuroscience conference that includes invited talks, demonstrations, symposia and oral and poster presentations of refereed papers. Following the conference, there are workshops which provide a less formal setting.

Gefällt euch das Format? Vertraut auf SlidesLive, um euer nächstes Event festzuhalten!

Professionelle Aufzeichnung und Livestreaming – weltweit.

Freigeben

Empfohlene Videos

Präsentationen, deren Thema, Kategorie oder Sprecher:in ähnlich sind

DECAF: Generating Fair Synthetic Data Using Causally-Aware Generative Networks

09:53

DECAF: Generating Fair Synthetic Data Using Causally-Aware Generative Networks

Zhlédnout později

Oblíbené

Trent Kyono, …

NeurIPS 2021 3 years ago

Time-series Generation by Contrastive Imitation

08:47

Time-series Generation by Contrastive Imitation

Zhlédnout později

Oblíbené

Dan Jarrett, …

NeurIPS 2021 3 years ago

Revisiting Deep Learning Models for Tabular Data

12:14

Revisiting Deep Learning Models for Tabular Data

Zhlédnout později

Oblíbené

Yury Gorishniy, …

NeurIPS 2021 3 years ago

Communication-Efficient Federated Learning for Neural Machine Translation

05:00

Communication-Efficient Federated Learning for Neural Machine Translation

Zhlédnout později

Oblíbené

Tanya Roosta, …

NeurIPS 2021 3 years ago

Parametrized Quantum Policies for Reinforcement Learning

14:12

Parametrized Quantum Policies for Reinforcement Learning

Zhlédnout později

Oblíbené

Sofiene Jerbi, …

NeurIPS 2021 3 years ago

Multi-Agent Reinforcement Learning in Stochastic Networked Systems

11:20

Multi-Agent Reinforcement Learning in Stochastic Networked Systems

Zhlédnout později

Oblíbené

Yiheng Lin, …

NeurIPS 2021 3 years ago