Rajkumar Ramamurthy, Prithviraj Ammanabrolu, Kianté Brantley, Jack Hessel, Rafet Sifa, Christian Bauckhage, Hanna Hajishirzi, Yejin Choi · Is Reinforcement Learning (Not) for NLP?: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization · SlidesLive

Categories

EN

Log in Talk to sales

Next

Livestream will start soon!

Livestream has already ended.

Presentation has not been recorded yet!

SlidesLive

title: Is Reinforcement Learning (Not) for NLP?: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization

0:00 / 0:00

Report Issue
Settings
Playlists
Bookmarks
Subtitles Off
Playback rate
Quality

Settings
Debug information
Server sl-yoda-v2-stream-001-alpha.b-cdn.net
Subtitles size Medium

Bookmarks

Server
sl-yoda-v2-stream-001-alpha.b-cdn.net
sl-yoda-v2-stream-001-beta.b-cdn.net
1824830694.rsc.cdn77.org
1979322955.rsc.cdn77.org

Subtitles
Off
English

Playback rate

Quality

Subtitles size
Large
Medium
Small

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

Is Reinforcement Learning (Not) for NLP?: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization

Is Reinforcement Learning (Not) for NLP?: Benchmarks, Baselines, and Building Blocks for Natural Language Policy Optimization

Dec 2, 2022

Speakers

Rajkumar Ramamurthy

Speaker · 0 followers

Prithviraj Ammanabrolu

Speaker · 0 followers

Kianté Brantley

Speaker · 0 followers

Organizer

NeurIPS 2022

Account · 954 followers

Like the format? Trust SlidesLive to capture your next event!

Professional recording and live streaming, delivered globally.

Sharing

Recommended Videos

Presentations on similar topic, category or speaker

Computationally Efficient Horizon-Free Reinforcement Learning for Linear Mixture MDPs

04:50

Computationally Efficient Horizon-Free Reinforcement Learning for Linear Mixture MDPs

Watch later

Favorite

Dongruo Zhou, …

NeurIPS 2022 2 years ago

PolarMix: A General Data Augmentation Technique for LiDAR Point Clouds

04:23

PolarMix: A General Data Augmentation Technique for LiDAR Point Clouds

Watch later

Favorite

Aoran Xiao, …

NeurIPS 2022 2 years ago

Dynamic Pricing with Monotonicity Constraint under Unknown Parametric Demand Model

00:59

Dynamic Pricing with Monotonicity Constraint under Unknown Parametric Demand Model

Watch later

Favorite

NeurIPS 2022 2 years ago

My considerations on Machine Learning

25:37

My considerations on Machine Learning

Watch later

Favorite

NeurIPS 2022 2 years ago

Learning to Find Proofs and Theorems by Learning to Refine Search Strategies

05:03

Learning to Find Proofs and Theorems by Learning to Refine Search Strategies

Watch later

Favorite

Jonathan Laurent, …

NeurIPS 2022 2 years ago

Tiered Reinforcement Learning: Pessimism in the Face of Uncertainty and Constant Regret

01:01

Tiered Reinforcement Learning: Pessimism in the Face of Uncertainty and Constant Regret

Watch later

Favorite

Jiawei Huang, …

NeurIPS 2022 2 years ago