🛠️ Steven Gong

Search

Aug 19, 2025, 1 min read

Offline Q-Learning on Diverse Multi-Task Data Both Scales And Generalizes

They talk about C51 paper for doing distributional RL.

Graph View

Backlinks

Scaling RL

Created with Quartz, © 2026

Blog
LinkedIn
Twitter
GitHub