6 13 10

Wenhao Yu

wyu1

https://wyu97.github.io/

wyu97

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents

upvoted a paper 16 days ago

Don't Throw Away Your Pretrained Model

commented on a paper 16 days ago

Don't Throw Away Your Pretrained Model

View all activity

Organizations

upvoted a paper 5 days ago

Explore to Evolve: Scaling Evolved Aggregation Logic via Proactive Online Exploration for Deep Research Agents

Paper • 2510.14438 • Published 17 days ago • 13

upvoted a paper 16 days ago

Don't Throw Away Your Pretrained Model

Paper • 2510.09913 • Published 22 days ago • 4

upvoted a paper 20 days ago

BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation via Execution

Paper • 2510.08697 • Published 24 days ago • 34

upvoted a paper about 1 month ago

Evolving Language Models without Labels: Majority Drives Selection, Novelty Promotes Variation

Paper • 2509.15194 • Published Sep 18 • 33

upvoted a paper about 2 months ago

Parallel-R1: Towards Parallel Thinking via Reinforcement Learning

Paper • 2509.07980 • Published Sep 9 • 98

upvoted a paper 2 months ago

Self-Rewarding Vision-Language Model via Reasoning Decomposition

Paper • 2508.19652 • Published Aug 27 • 84

upvoted 2 papers 3 months ago

R-Zero: Self-Evolving Reasoning LLM from Zero Data

Paper • 2508.05004 • Published Aug 7 • 126

VeriGUI: Verifiable Long-Chain GUI Dataset

Paper • 2508.04026 • Published Aug 6 • 158

upvoted a paper 7 months ago

Towards Trustworthy GUI Agents: A Survey

Paper • 2503.23434 • Published Mar 30 • 21

upvoted a paper 9 months ago

OpenCharacter: Training Customizable Role-Playing LLMs with Large-Scale Synthetic Personas

Paper • 2501.15427 • Published Jan 26 • 6

upvoted 2 papers about 1 year ago

LEOPARD : A Vision Language Model For Text-Rich Multi-Image Tasks

Paper • 2410.01744 • Published Oct 2, 2024 • 26

DSBench: How Far Are Data Science Agents to Becoming Data Science Experts?

Paper • 2409.07703 • Published Sep 12, 2024 • 67

upvoted an article over 1 year ago

Article

BigCodeBench: Benchmarking Large Language Models on Solving Practical and Challenging Programming Tasks

Jun 18, 2024

• 52

Wenhao Yu

AI & ML interests

Recent Activity

Organizations

wyu1's activity

BigCodeBench: Benchmarking Large Language Models on Solving Practical and Challenging Programming Tasks