Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Debasish's picture

1

Debasish

dkhan05

·

AI & ML interests

None yet

Organizations

dkhan05 's collections 1

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 3.67k • 587

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 420
nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 3.67k • 587

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs