🛠️ Steven Gong

Search

Conservative Q-Learning for Offline Reinforcement Learning (CQL)
Related

Aug 29, 2025, 1 min read

Conservative Q-Learning for Offline Reinforcement Learning (CQL)

Introduced to me by Jason Ma.

This is how you do Offline RL without so much bias. Honestly, I’m still quite confused by it.

Related

Cal-QL

Graph View

Backlinks

Distributional Shift
Offline Reinforcement Learning
Policy Extraction
Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning

Created with Quartz, © 2026

Blog
LinkedIn
Twitter
GitHub