Haitao Mi's picture

1 28 3

Haitao Mi

haitaominlp

·

https://scholar.google.com.sg/citations?user=G3OMbFSm858C&hl=en

AI & ML interests

Large Language Models

Recent Activity

upvoted a paper 3 days ago

Group Distributionally Robust Optimization-Driven Reinforcement Learning for LLM Reasoning

upvoted a collection 3 days ago

upvoted a paper about 2 months ago

Can LLMs Guide Their Own Exploration? Gradient-Guided Reinforcement Learning for LLM Reasoning

View all activity

Organizations

haitaominlp 's models

None public yet