预估——CTR预估中的样本采样

待更新


CTR预估的样本采样

  • CTR预估任务中,正负样本可能偏差很多,此时需要做样本采样,以提升训练速度和效果
    • “负采样可以提升训练速度和模型效果”来自论文《Practical Lessons from Predicting Clicks on Ads at
      Facebook》

CTR预估样本采样后的校准

  • 方法一
  • 方法二【常用方式】
    • 假设负采样比例为\(w\),原始预估值为\(p\),则校准后的预估值\(q\)为:
      $$
      \begin{align}
      q = \frac{p}{p+(1-p)/w}
      \end{align}
      $$
    • 具体实现如下:
      1
      2
      3
      logits = ctr_mlp_layer(input)
      pctr = tf.nn.sigmoid(logits)
      final_pctr = pctr / (pctr + (1 - pctr) / negative_downsampling_rate)