通过监测与奖励诚实出价优化拍卖收入本文探讨了一种创新的拍卖机制设计，该机制通过延迟检查和事后奖励来激励买家报出更接近其真

监测和奖励诚实出价以提高拍卖收入

某中心的学者Alexandre Belloni探讨了拍卖设计对数字商品的影响。

Alexandre Belloni自巴西里约热内卢天主教大学电气工程本科时期起，就对运筹学和优化问题产生了浓厚兴趣。在里约热内卢纯粹与应用数学研究所攻读数学经济学硕士学位时，他的课程恰好有很强的优化方向。他表示："到了那里，经济学的影响开始显现。鉴于我的背景，我一直在寻找运筹学与经济学的交叉点。" Belloni在麻省理工学院运筹学中心攻读博士学位期间，专注于优化和计量经济学。他对经济学的兴趣继续影响着他的学术道路，他当前的大部分研究都集中在机制设计问题上，他将其描述为"一大类分配资源的方式"。"例如，拍卖是一种分配物品的经典方式，在难以对物品进行定价的情况下尤其有用。"

Belloni认为机制设计是一个令人难以置信的研究领域。"不仅有许多有趣的视角需要考虑——例如信息、计算、近似、鲁棒性、动态性——而且我们也看到许多行业问题需要协调去中心化系统。"自2007年以来，Belloni还在杜克大学福库商学院任教，目前是该校决策科学领域的John D. Forsyth教授。2018年，他被招募为某中心学者，并于2019年1月以该身份加入某中心。"我一直认为，最好的研究是由经验的、真实的问题所驱动的。某中心让你有很好的机会看到真实的问题。"他说。

此后，他一直研究某机构供应链优化技术组织内，与"由某机构配送"服务相关的机制设计和机器学习问题。"由某机构配送"是为使用某机构存储和配送能力的第三方卖家设立的分支机构。Belloni及其同事目前正在应对的挑战之一与容量管理有关。第三方卖家拥有并控制自己的库存，而某机构在信息有限的情况下，决定如何平衡对仓储空间的需求，并确保配送中心容量得到高效利用，并能用于存放客户喜爱的产品。Belloni说："已经有大量出色的工作，我们继续痴迷于寻找更好的容量管理方法。"

协调和优化分配也是Belloni及其同事最近一项工作的核心。在题为《具有延迟检查和奖励的最优拍卖设计》的论文中，作者们开发了一种机制，通过奖励出价更接近物品真实价值的买家来激励拍卖中的买家提高出价。这种策略只能用于某些特定场景，即能够监测买家如何将该商品货币化。在这篇访谈中，Belloni讨论了与合著者Saeed Alaei、Ali Makhdoumi和Azarakhsh Malekian如何构思出这种特别适用于数字商品的新拍卖设计，以及它可能对收入产生的影响。

问：你们开发的优化拍卖设计的机制是什么？对数字商品有何影响？

答：这篇论文的关键在于，在某些场景下，拍卖获胜者揭晓后，我们可以实际了解到该商品对代理人（买家）的真实价值。确实，在许多场景中，价值会（近乎）在延迟后被观察到。在这些情况下，如果代理人说了实话——即出价接近真实价值——我们可以从其初始保证金中返还一笔奖金。事实证明，我们能够完全刻画单个代理人的最优机制。通过利用检查后的奖励来帮助我们筛选代理人，我们发现最优分配并非阈值策略，而是所报告价值的递增连续函数。实际上，对于相同的分配，可能存在不同的支付（通过奖励），这与没有检查的情况形成对比，在后者中没有这样的机制是激励相容的。

这些结果在能够监测商品对投标人价值（或性能）的场景中非常相关。数字商品无疑是激发我们设定情境的一个应用。例如，考虑一个平台希望为某个待展示的数字商品出售某个优先广告位。由于数字商品的消费发生在平台内部，其价值是可观测的，无论其是否是特定拍卖的赢家。因此，本文就如何在利用这种额外监测进行货币化的同时，仍允许代理人完全控制其为获得优先广告位而愿意支付的最大金额，提供了见解。这是有吸引力的，因为代理人总是关注责任问题，在实践中，他们可能不愿意接受一个不知道自己最终可能支付多少的合同。所以，我们正在考虑这种担忧。我们监测他们，但我们收取的费用不能超过他们出价的金额。代理人完全控制他们将花费多少。最终，我们奖励那些具有高价值的数字商品，以便能够通过监测进行更深入的筛选。

问：你们如何将结果从单一买家推广到多个买家？

答：鉴于第一个结果的普适性，结果如何推广到多代理情况起初并不明确。第一步是考虑所谓的简化形式表示，我们在此模型中，根据投标人自身的类型（通过对其他投标人的类型取平均），给出其期望分配和支付的表达式。但要确保简化形式可以作为拍卖实现，众所周知，还需要考虑额外的Border约束，这可能变得棘手。利用对偶理论，我们随后找到了一个充分条件，在该条件下，问题简化形式中的Border约束可以得到妥善处理。这个关于最大值分布的风险率的充分技术条件在单代理情况下并不需要。确实，单代理的结果具有相当的普适性。令人惊讶的是，单代理情况下的相同结构特性在多代理情况下仍然得以保留。

重要的是，我们为多代理提供了最优拍卖的实现——Border约束保证了实现的存在，但没有告诉我们如何实现。具体来说，我们展示了最优拍卖的实现涉及将物品分配给出价最高的代理人，然后在该代理人报告真实情况时给予奖励。这种带有检查的设置的一个方面是，我们可以通过更自由地操纵分配量和支付金额来进一步区分投标人。在典型的没有检查的拍卖中，这样做没有价值，代理人要么得到物品，要么得不到。在我们的案例中，例如，如果你出价低，我们实际上可以只给你50%的机会获得该物品。确实，随着出价的提高，我们增加分配物品的机会，当我们达到100%的机会时，我们可以进一步提高报告正确的奖励。所以，如果你考虑第二价格拍卖，例如，代理人支付第二高的价格，就是这样。在这里，监测允许我们在他们出价后进一步筛选投标人，从而通过奖金来细化最终支付。因此，投标人有额外的动机去支付更多（即使在单代理情况下），只是为了确保他们有更高的机会获得商品。

问：你们的优化对收入有什么影响？这与经典场景中的拍卖有何不同？

答：这种拍卖设计上会比标准选项（没有监测）产生更高的收入。直观地说，因为有奖金，如果代理人试图通过出价太低来占便宜，他们就不会得到任何奖金返还。现在，如果代理人告诉你真相，那么他们将获得一笔可观的奖金。所以，这创造了一种激励，使他们愿意向真实价值靠拢。

在论文中，我们很好地刻画了为什么收入会更高。拍卖的典型思想是，你需要为代理人支付信息租金。而发生的情况是，这种监测通过设计减少了信息租金。更准确地说，信息租金的减少因子与代理人可能提出的最佳替代出价有关。这在数学上表现得非常清楚。

我们不能说我们将增加20%或30%，因为这取决于具体公司的情况。然而，请注意，这在代理人数量较少的情况下影响尤其显著。例如，在稀薄市场中只有一个投标人，通常可以带走大量剩余。在特定设置（取决于分布、代理人数等）下，我们在论文中提供了收益显著的例子。尽管如此，我们可以明确地说，我们总是减少了信息租金。