Jiahong 的个人博客
凡事预则立,不预则废
Home
Tags
Archives
Navigation
Search
NLP
Tag
NLP——Not-Just-Scaling-Laws
NLP——将传统强化学习Trick用到LLM中的思考
NLP——MHA2MLA(Partial-RoPE)
NLP——Megatron-LM原始论文解读-第一篇
NLP——Megatron-LM原始论文解读-第二篇
NLP——Megatron-LM原始论文解读-第三篇
NLP——GShard
NLP——DeepCoder
NLP——DeepScaleR
NLP——AReaL
1
…
5
6
7
…
18