zhongyuan peng's picture

3 12 3

zhongyuan peng

happzy2633

·

Happzy-WHU

AI & ML interests

None yet

Recent Activity

upvoted a paper 14 days ago

OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs

upvoted a paper 2 months ago

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

upvoted a paper 3 months ago

Efficient Agents: Building Effective Agents While Reducing Cost

View all activity

Organizations

upvoted a paper 14 days ago

OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs

Paper • 2510.10689 • Published 16 days ago • 46

upvoted a paper 2 months ago

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

Paper • 2508.11987 • Published Aug 16 • 69

upvoted 2 papers 3 months ago

Efficient Agents: Building Effective Agents While Reducing Cost

Paper • 2508.02694 • Published Jul 24 • 85

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

Paper • 2508.02193 • Published Aug 4 • 130

upvoted 3 papers 4 months ago

CriticLean: Critic-Guided Reinforcement Learning for Mathematical Formalization

Paper • 2507.06181 • Published Jul 8 • 43

OAgents: An Empirical Study of Building Effective Agents

Paper • 2506.15741 • Published Jun 17 • 35

Scaling Test-time Compute for LLM Agents

Paper • 2506.12928 • Published Jun 15 • 63

upvoted a paper 8 months ago

SuperGPQA: Scaling LLM Evaluation across 285 Graduate Disciplines

Paper • 2502.14739 • Published Feb 20 • 104

upvoted a paper 12 months ago

Chinese SimpleQA: A Chinese Factuality Evaluation for Large Language Models

Paper • 2411.07140 • Published Nov 11, 2024 • 35

upvoted 3 papers about 1 year ago

A Comparative Study on Reasoning Patterns of OpenAI's o1 Model

Paper • 2410.13639 • Published Oct 17, 2024 • 19

MTU-Bench: A Multi-granularity Tool-Use Benchmark for Large Language Models

Paper • 2410.11710 • Published Oct 15, 2024 • 20

FuzzCoder: Byte-level Fuzzing Test via Large Language Model

Paper • 2409.01944 • Published Sep 3, 2024 • 45