yang bai's picture

yang bai

byang

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

Multi-Objective and Mixed-Reward Reinforcement Learning via Reward-Decorrelated Policy Optimization

liked a dataset 4 days ago

Mxode/Chinese-Instruct

liked a dataset 4 days ago

zai-org/LongAlign-10k

View all activity

Organizations

None yet

Papers 8

arxiv:2601.16725

arxiv:2512.23966

arxiv:2510.23081

arxiv:2510.04617

models 0

None public yet

datasets 0

None public yet