待更新
CTR预估的样本采样
- CTR预估任务中,正负样本可能偏差很多,此时需要做样本采样,以提升训练速度和效果
- “负采样可以提升训练速度和模型效果”来自论文《Practical Lessons from Predicting Clicks on Ads at
Facebook》
- “负采样可以提升训练速度和模型效果”来自论文《Practical Lessons from Predicting Clicks on Ads at
CTR预估样本采样后的校准
- 方法一
- 参见ctr 校准的方式中的推导
- 方法二【常用方式】
- 假设负采样比例为\(w\),原始预估值为\(p\),则校准后的预估值\(q\)为:
$$
\begin{align}
q = \frac{p}{p+(1-p)/w}
\end{align}
$$ - 具体实现如下:
1
2
3logits = ctr_mlp_layer(input)
pctr = tf.nn.sigmoid(logits)
final_pctr = pctr / (pctr + (1 - pctr) / negative_downsampling_rate)
- 假设负采样比例为\(w\),原始预估值为\(p\),则校准后的预估值\(q\)为: