Zican Hu's picture

14

Zican Hu

huzican

·

[email protected]

AI & ML interests

None yet

Recent Activity

upvoted a paper 12 days ago

SimpleVLA-RL: Scaling VLA Training via Reinforcement Learning

upvoted a paper 17 days ago

Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents

upvoted a paper 18 days ago

Diversity-Incentivized Exploration for Versatile Reasoning

View all activity

Organizations

None yet

Collections 1

Papers 6

arxiv:2509.26209

arxiv:2506.05426

arxiv:2505.19761

arxiv:2504.15046

models 6

huzican/Qwen2.5-Math-7B-16k-think

7B • Updated 19 days ago • 14

huzican/Baseline-Entropy-RL-Qwen2.5-Math-7B

7B • Updated 19 days ago • 13

huzican/Baseline-Clip-Higher-Qwen2.5-Math-7B

7B • Updated 19 days ago • 12

huzican/Baseline-Passk-Training-Qwen2.5-Math-7B

7B • Updated 19 days ago • 10

huzican/DIVER-TD-Qwen2.5-Math-7B

7B • Updated 19 days ago • 15

huzican/DIVER-ED-Qwen2.5-Math-7B

7B • Updated 19 days ago

datasets 2

huzican/DIVER-Test

Viewer • Updated 19 days ago • 6.02k • 14

huzican/DIVER-Training-Openr1-Math-46k

Viewer • Updated 19 days ago • 45.8k • 20