Jiahong 的个人博客
凡事预则立,不预则废
Home
Tags
Archives
Navigation
Search
NLP
Tag
NLP——SEAL
NLP——将传统强化学习Trick用到LLM中的思考
NLP——MHA2MLA(Partial-RoPE)
NLP——GShard
NLP——Megatron-LM原始论文解读-第三篇
NLP——LLM-API调用示例
NLP——Megatron-LM原始论文解读-第二篇
NLP——样本packing与权重讨论
NLP——DeepCoder
NLP——DeepScaleR
1
…
8
9
10
…
21