Jiahong 的个人博客

凡事预则立，不预则废

Home
Tags
Archives
Navigation
Search

NLPTag

NLP——LLM对齐微调-SDPO

NLP——LLM对齐微调-SDPO(Segment-Level-DPO)

NLP——技术报告解读-Step-3.5-Flash

NLP——旋转位置编码-RoPE

NLP——VeRL框架使用总结

NLP——vLLM使用相关笔记

NLP——技术报告解读-DeepSeek-R1

NLP——Model-Growth-Initialization

NLP——Not-Just-Scaling-Laws

NLP——Reinforcement-Pre-Training

1…678…20

Joe Zhou

Stay Hungry. Stay Foolish.

GitHub E-Mail

© 2026 Joe Zhou

Powered by Hexo

|

Theme — NexT.Gemini v5.1.4