12 26 25

ZhuofengLi

https://github.com/Zhuofeng-Li

AI & ML interests

Agents, Reasoning LLMs/VLLMs, RL

Recent Activity

updated a dataset 9 days ago

ZhuofengLi/bcp-eval-logs

published a dataset 9 days ago

ZhuofengLi/bcp-eval-logs

updated a dataset 9 days ago

ZhuofengLi/bcplus-eval-100

View all activity

Organizations

updated a dataset 9 days ago

ZhuofengLi/bcp-eval-logs

Viewer • Updated 9 days ago • 238 • 6

published a dataset 9 days ago

ZhuofengLi/bcp-eval-logs

Viewer • Updated 9 days ago • 238 • 6

updated a dataset 9 days ago

ZhuofengLi/bcplus-eval-100

Viewer • Updated 9 days ago • 1.53k • 9

published a dataset 9 days ago

ZhuofengLi/bcplus-eval-100

Viewer • Updated 9 days ago • 1.53k • 9

upvoted a paper 10 days ago

ClawBench: Can AI Agents Complete Everyday Online Tasks?

Paper • 2604.08523 • Published 12 days ago • 255

upvoted a paper 12 days ago

Watch Before You Answer: Learning from Visually Grounded Post-Training

Paper • 2604.05117 • Published 15 days ago • 35

updated a dataset 13 days ago

ZhuofengLi/ir-eval-benchmark

Viewer • Updated 13 days ago • 600 • 46

published a dataset 13 days ago

ZhuofengLi/ir-eval-benchmark

Viewer • Updated 13 days ago • 600 • 46

upvoted a paper 20 days ago

ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

Paper • 2603.27862 • Published 22 days ago • 30

upvoted a paper 26 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published Mar 17 • 94

updated 4 datasets 26 days ago

updated a model 26 days ago

OpenResearcher/OpenResearcher-30B-A3B

Text Generation • 32B • Updated 26 days ago • 1.27k • 67

authored a paper 27 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published Mar 17 • 94

updated a collection 27 days ago

OpenResearcher

Collection

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis • 8 items • Updated 27 days ago • 17

submitted a paper to Daily Papers 27 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published Mar 17 • 94

updated a dataset about 1 month ago

ZhuofengLi/browsecomp-plus

Viewer • Updated Mar 19 • 5 • 53

published a dataset about 1 month ago

ZhuofengLi/browsecomp-plus

Viewer • Updated Mar 19 • 5 • 53

ZhuofengLi

AI & ML interests

Recent Activity

Organizations

ZhuofengLi's activity