RS——从CG到NDCG评估指标

CG（Cumulative Gain，累计增益），DCG（Discounted Cumulative Gain，折损累计增益）和NDCG（Normalized Discounted Cumulative Gain，归一化折损累计增益）是信息检索和推荐系统中常用的评估指标，用于衡量排序结果的质量

定义：在CG基础上引入位置折损 ，排名越靠后的结果对总增益的贡献越小
公式（常用版本） ：
$$
DCG@k = \sum_{i=1}^k \frac{rel_i}{\log_2(i+1)}
$$
- 折损因子 ：$ \log_2(i+1) $ 会随着位置$ i $增大而降低当前结果的贡献
变体（更强调相关性） ：
$$
DCG@k = \sum_{i=1}^k \frac{2^{rel_i} - 1}{\log_2(i+1)}
$$
- 适用于相关性分数差异较大的场景（如0/1/3/5分级）

定义：将DCG除以理想排序下的DCG（IDCG） ，得到归一化分数（0~1之间）
公式：
$$
NDCG@k = \frac{DCG@k}{IDCG@k}
$$
- $ IDCG@k $：将前$ k $个结果按相关性从高到低排序后计算的DCG（即理论最大值）
特点：
- 值越接近1，排序越接近理想状态
- 解决了不同查询间DCG无法直接比较的问题（因为不同查询的IDCG可能不同）

TLDR：MRR（Mean Reciprocal Rank）是对每个查询的相关文档在推荐列表中排名的倒数的平均值
具体计算方法为：
$$MRR=\frac{1}{|Q|}\sum_{i=1}^{|Q|}\frac{1}{rank_i}$$
- $|Q|$是查询的总数
- $rank_i$是第$i$个查询中第一个相关文档在推荐列表中的排名
- 如果一个查询在推荐列表中没有相关文档，则该查询对MRR的贡献为$0$
MRR主要用于衡量推荐系统在返回相关结果时的排序能力，它特别关注第一个相关结果在推荐列表中的位置，能够反映出推荐系统将最相关的项目排在前面的能力
举例：假设用户有3个查询，对应的推荐列表及相关文档的排名如下：
- 查询1：推荐列表为$$D_3,D_1,D_2$$，其中$D_1$是相关文档，排名为$2$，则该查询的$\frac{1}{rank}=\frac{1}{2}$
- 查询2：推荐列表为$$D_2,D_4,D_1$$，相关文档$D_2$排名为$1$，该查询的$\frac{1}{rank}=1$
- 查询3：推荐列表为$$D_3,D_4,D_5$$，没有相关文档，该查询的$\frac{1}{rank}=0$
- 那么$MRR = \frac{(\frac{1}{2}+1+0)}{3}=\frac{1.5}{3}=0.5$