Sirui Zhang's picture

29 16

Sirui Zhang

zsr200901

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 10 hours ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper 3 days ago

PaCoRe: Learning to Scale Test-Time Compute with Parallel Coordinated Reasoning

liked a model 3 days ago

lmsys/gpt-oss-20b-bf16

View all activity

Organizations

zsr200901 's datasets

None public yet