Harshit Sikchi, Akanksha Saran, Wonjoon Goo, Scott Niekum · A Ranking Game for Imitation Learning · SlidesLive

Kategorie

CS

Přihlásit se Kontaktujte nás

Další

Živý přenos začne již brzy!

Živý přenos již skončil.

Prezentace ještě nebyla nahrána!

SlidesLive

title: A Ranking Game for Imitation Learning

0:00 / 0:00

Nahlásit chybu
Nastavení
Playlisty
Záložky
Titulky Off
Rychlost přehrávání
Kvalita

Nastavení
Debug informace
Server sl-yoda-v2-stream-007-alpha.b-cdn.net
Velikost titulků Střední

Záložky

Server
sl-yoda-v2-stream-007-alpha.b-cdn.net
sl-yoda-v2-stream-007-beta.b-cdn.net
1678031076.rsc.cdn77.org
1932936657.rsc.cdn77.org

Titulky
Off
English

Rychlost přehrávání

Kvalita

Velikost titulků
Velké
Střední
Malé

Mode
Video Slideshow
Audio Slideshow
Slideshow
Video

A Ranking Game for Imitation Learning

A Ranking Game for Imitation Learning

2. prosince 2022

Řečníci

Harshit Sikchi

Řečník · 0 sledujících

Akanksha Saran

Řečník · 0 sledujících

Wonjoon Goo

Řečník · 0 sledujících

O prezentaci

We propose a new framework for imitation learning—treating imitation as a two-player ranking-based game between a policy and a reward. In this game, the reward agent learns to satisfy pairwise performance rankings between behaviors, while the policy agent learns to maximize this reward. In imitation learning, near-optimal expert data can be difficult to obtain, and even in the limit of infinite data cannot imply a total ordering over trajectories as preferences can. On the other hand, learning f…

Organizátor

NeurIPS 2022

Účet · 961 sledujících

Baví vás formát? Nechte SlidesLive zachytit svou akci!

Profesionální natáčení a streamování po celém světě.

Sdílení

Doporučená videa

Prezentace na podobné téma, kategorii nebo přednášejícího

Equivariant Networks for Zero-Shot Coordination

02:54

Equivariant Networks for Zero-Shot Coordination

Zhlédnout později

Oblíbené

Darius Muglich, …

NeurIPS 2022 2 years ago

Best paper announcement

00:52

Best paper announcement

Zhlédnout později

Oblíbené

NeurIPS 2022 2 years ago

Chefs' Random Tables: Non-Trigonometric Random Features

04:54

Chefs' Random Tables: Non-Trigonometric Random Features

Zhlédnout později

Oblíbené

Valerii Likhosherstov, …

NeurIPS 2022 2 years ago

EvenNet: Ignoring Odd-Hop Neighbors Improves Robustness of Graph Neural Networks

01:06

EvenNet: Ignoring Odd-Hop Neighbors Improves Robustness of Graph Neural Networks

Zhlédnout později

Oblíbené

Runlin Lei, …

NeurIPS 2022 2 years ago

Graph Neural Network Bandits

04:27

Graph Neural Network Bandits

Zhlédnout později

Oblíbené

Parnian Kassraie, …

NeurIPS 2022 2 years ago

CLEAR: Generative Counterfactual Explanations on Graphs

04:36

CLEAR: Generative Counterfactual Explanations on Graphs

Zhlédnout později

Oblíbené

NeurIPS 2022 2 years ago