以下思考仅为笔者与其他同事讨论时的一些想法,仅供参考
背景
- 疑问:拍卖机制的激励兼容是指机制能否让商家说真话时从系统获得最大收益,但在智能出价时,还支持激励兼容吗?
- 激励兼容(IC)的定义:讲真话是利益相关者在这个机制下的最优选择
- 占优策略激励兼容的定义:竞拍者的真实出价是一个占优策略,且效用非负
- 竞拍者的占优策略是指,无论别人怎么出价,这样出价对该竞拍者来说都是最好的
回答
- 从计费方式上看,由于系统为了保ROI会计费到满足商家出价ROI,本质上算是ROI上的一价计费,从这里看不能算是激励兼容了
- 另外,激励兼容有个等价表达是,同时满足以下两个条件:
- 第一,分配规则:随着出价提升,分配到的资源是单调不减
- 第二,计费规则:净胜者需要支付的数额等于将使他赢得拍卖的最小值
- 在oCPC中(假设商家投放期间固定目标ROI),可以算是激励兼容的,但是比较弱:
- 分配规则:流量可以看做是连续的,所以流量随着商家出价是单调递增的,分配规则满足激励兼容
- 计费规则:由于流量是随着出价单调递增的, 所以实际上,商家计费对应的流量就是他拿到这些流量的最小计费
- 但是,从商家视角考虑,随着出价增多,边际效益递减(流量会越来越贵),再增加支付成本拿到的流量并不多,所以其实容易出现计费高了,但是流量涨幅不多(甚至相当于没涨),从这个角度来讲,好像上述两条激励兼容的满足又有点弱。
其他思考(非严格证明)
- 如果把智能出价下的系统分成两层
- 第一层:对每个投放周期内,商家出价,给出指定目标(目标在每个投放周期内固定),比如ROI约束下最大化点击的产品,商家出价则是目标ROI值
- 第二层:对每个请求,智能出价在商家约束和目标下,智能体给出满足商家约束且能最大化商家效果的单次出价
- 在第一层中,激励兼容可以理解为:每个投放周期内,商家都会说真话,选择一个自己能接受且能最大化自己效果的目标值,比这个目标值小或大都不符合商家利益
- 此时每个投放周期内,对一个商家来说,系统都在进行一次拍卖,是对一个投放周期内整体流量进行打包拍卖,商家出一次价即可购买一定量的效果,这种拍卖不是0-1拍卖,不是简单的拍卖成功或拍卖失败,而是给出一个连续的出价目标,对应一个连续成本和一个连续的收益,成本和收益之间一般是正相关关系
- 在第二层中,激励兼容可以理解为:每个请求下,智能体给出的出价都是达成商家目标所能给出的最优出价,即能让自己收益最大化的最优出价
- 当然,此时商家出价不再仅仅与这次拍卖相关,而是与整个投放周期内的成本和效果相关