ML——课程学习

在机器学习领域，课程学习（Curriculum Learning，CL） 训练策略，适用场景广泛，包括监督学习，强化学习等场景
课程学习的核心思想是让模型从简单任务逐步过渡到复杂任务，如同人类在学习新知识时先掌握基础概念，再逐渐挑战更难的内容
思路：人类学习遵循“从易到难”的顺序，课程学习希望通过模拟这一过程，提升机器学习模型的学习效率和泛化能力
定义：通过设计一个“课程”，即按照任务难度排序的训练数据序列，让模型先在简单任务上学习，再逐步增加任务复杂度，最终掌握目标任务
优点：
- 从简单任务入手可帮助模型更快收敛，减少训练时间（如CV中先学识别简单物体边缘，再学完整物体）
- 逐步积累的知识体系让模型更适应复杂场景，减少过拟合（如语音识别中先学干净语音，再学带噪声语音）
- 复杂任务直接训练可能陷入局部最优，课程学习通过分阶段优化降低难度（如神经网络训练中的逐层预训练）
它不仅适用于传统监督学习，还在强化学习、多任务学习等领域展现出潜力。随着算法对“任务难度”理解的深化，未来课程学习可能成为解决复杂AI任务的关键策略之一

任务难度定义 ：衡量任务的“难易程度”，常通过数据的特征复杂度、样本数量和模型在任务上的预测准确率等来评估任务难度
课程设计策略 ：人工划分或自动划分
- NLP 中先学短文本分类，再学长文本（人工划分）
- 基于数据相似度聚类，先训练简单簇，再逐步引入复杂簇（自动划分）
- 根据模型当前表现，动态选择下一个合适的任务（自动划分）
训练过程 ：模型在每阶段完成后，保留已学知识，并将新知识与旧知识结合，避免“灾难性遗忘”