Jiahong 的个人博客

凡事预则立,不预则废


  • Home

  • Tags

  • Archives

  • Navigation

  • Search
Excellent! 659 posts in total. Keep on posting.

Python——OrderedDict类的使用

Math——博弈论-Shapley-Value

Math——证明笔记-对数似然的梯度期望为零

NLP——LLM排行榜

NLP——HF-Trainer使用总结

NLP——WizardLM(Evol-Instruct)

NLP——Megatron框架的使用

NLP——LLM对齐微调相关总结

RL——DDPO

RL——Decision-Transformer

1…171819…66
Joe Zhou

Joe Zhou

Stay Hungry. Stay Foolish.

659 posts
53 tags
GitHub E-Mail
© 2026 Joe Zhou
Powered by Hexo
|
Theme — NexT.Gemini v5.1.4