Jiahong 的个人博客

凡事预则立,不预则废


  • Home

  • Tags

  • Archives

  • Navigation

  • Search

NLPTag

NLP——LLM对齐微调-VC-PPO

NLP——技术报告解读-DeepSeek-V3

NLP——旋转位置编码-RoPE

NLP——VeRL框架使用总结

NLP——vLLM使用相关笔记

NLP——技术报告解读-DeepSeek-R1

NLP——Not-Just-Scaling-Laws

NLP——Model-Growth-Initialization

NLP——SEAL

NLP——将传统强化学习Trick用到LLM中的思考

1…567…19
Joe Zhou

Joe Zhou

Stay Hungry. Stay Foolish.

628 posts
53 tags
GitHub E-Mail
© 2026 Joe Zhou
Powered by Hexo
|
Theme — NexT.Gemini v5.1.4