预估——CTR预估中的样本采样

参考链接：
- 参考文献：ctr 校准的方式
- 论文：《Practical Lessons from Predicting Clicks on Ads at Facebook》

CTR 预估的样本采样

CTR 预估任务中，正负样本可能偏差很多，此时需要做样本采样，以提升训练速度和效果
- “负采样可以提升训练速度和模型效果”来自论文《Practical Lessons from Predicting Clicks on Ads at Facebook》

CTR 预估样本采样后的校准

方法一
- 参见ctr 校准的方式中的推导
方法二【常用方式】
- 假设负采样比例为 \(w\)，原始预估值为 \(p\)，则校准后的预估值 \(q\) 为：
  $$
  \begin{align}
  q = \frac{p}{p+(1-p)/w}
  \end{align}
  $$
- 具体实现如下：
  1
  2
  3
  logits = ctr_mlp_layer(input)
  pctr = tf.nn.sigmoid(logits)
  final_pctr = pctr / (pctr + (1 - pctr) / negative_downsampling_rate)