Jiahong 的个人博客
凡事预则立,不预则废
Home
Tags
Archives
Navigation
Search
NLP
Tag
NLP——技术报告解读-DeepSeek-R1
NLP——Model-Growth-Initialization
NLP——Not-Just-Scaling-Laws
NLP——SEAL
NLP——Reinforcement-Pre-Training
NLP——将传统强化学习Trick用到LLM中的思考
NLP——MHA2MLA(Partial-RoPE)
NLP——GShard
NLP——Megatron-LM原始论文解读-第三篇
NLP——Megatron-LM原始论文解读-第一篇
1
…
8
9
10
…
21