Ming Yin, Yu Bai, Yu-Xiang Wang · Oral: Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning · SlidesLive

Categories

EN

Log in Talk to sales

Next

Livestream will start soon!

Livestream has already ended.

Presentation has not been recorded yet!

SlidesLive

title: Oral: Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning

0:00 / 0:00

Report Issue
Settings
Playlists
Bookmarks
Subtitles Off
Playback rate
Quality

Settings
Debug information
Server sl-yoda-v3-stream-012-alpha.b-cdn.net
Subtitles size Medium

Bookmarks

Server
sl-yoda-v3-stream-012-alpha.b-cdn.net
sl-yoda-v3-stream-012-beta.b-cdn.net
1338956956.rsc.cdn77.org
1656830687.rsc.cdn77.org

Subtitles
Off
English

Playback rate

Quality

Subtitles size
Large
Medium
Small

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Oral: Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning

Oral: Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning

Apr 14, 2021

Speakers

Ming Yin

Speaker · 0 followers

Yu Bai

Speaker · 0 followers

Yu-Xiang Wang

Speaker · 0 followers

About

The problem of \emph{Offline Policy Evaluation} (OPE) in Reinforcement Learning (RL) is a critical step towards applying RL in real life applications. Existing work on OPE mostly focus on evaluating a \emph{fixed} target policy $\pi$, which does not provide useful bounds for offline policy learning as $\pi$ will then be data-dependent. We address this problem by \emph{simultaneously} evaluating all policies in a policy class $\Pi$ --- uniform convergence in OPE --- and obtain nearly optimal erro…

Organizer

AISTATS 2021

Account · 63 followers

Categories

AI & Data Science

Category · 10.8k presentations

About AISTATS 2021

The 24th International Conference on Artificial Intelligence and Statistics was held virtually from Tuesday, 13 April 2021 to Thursday, 15 April 2021.

Like the format? Trust SlidesLive to capture your next event!

Professional recording and live streaming, delivered globally.

Sharing

Recommended Videos

Presentations on similar topic, category or speaker

Fundamental Limits of Ridge-Regularized Empirical Risk Minimization in High Dimensions

03:33

Fundamental Limits of Ridge-Regularized Empirical Risk Minimization in High Dimensions

Watch later

Favorite

Hossein Taheri, …

AISTATS 2021 4 years ago

Private optimization without constraint violations

02:45

Private optimization without constraint violations

Watch later

Favorite

Andrés Munoz Medina, …

AISTATS 2021 4 years ago

Deep Neural Networks Are Congestion Games: From Loss Landscape to Wardrop Equilibrium and Beyond

02:50

Deep Neural Networks Are Congestion Games: From Loss Landscape to Wardrop Equilibrium and Beyond

Watch later

Favorite

Nina Vesseron, …

AISTATS 2021 4 years ago

Implicit Regularization via Neural Feature Alignment

03:15

Implicit Regularization via Neural Feature Alignment

Watch later

Favorite

Aristide Baratin, …

AISTATS 2021 4 years ago

Efficient Methods for Structured Nonconvex-Nonconcave Min-Max Optimization

03:33

Efficient Methods for Structured Nonconvex-Nonconcave Min-Max Optimization

Watch later

Favorite

Jelena Diakonikolas, …

AISTATS 2021 4 years ago

Fair for All: Best-effort Guarantees for Fairness in Classification

02:50

Fair for All: Best-effort Guarantees for Fairness in Classification

Watch later

Favorite

Anilesh Krishnaswamy, …

AISTATS 2021 4 years ago