在去年发表于《自然》杂志的一篇文章中,美国研究人员 Ryan Calo 和 Kate Crawford 呼吁“进行一项实用且广泛适用的社会系统分析,[该分析]要充分考虑人工智能系统对所有各方可能产生的所有影响, [借鉴]哲学、法律、社会学、人类学和科学技术研究等学科”。Calo 和 Crawford 的名单中没有包括经济学家。然而,正如这篇博客所指出的,经济学思维对这些重要的分析和辩论大有裨益。从算法决策的利弊、我们可以用来管理其弊端的组织设计以及更多决策对算法创造的价值的影响等方面来思考算法决策,可以帮助我们更好地决定何时以及如何使用它们。
这让我想起了杰伦·拉尼尔(Jaron Lanier)在 2010 年出版的《谁拥有未来》一书中提出的观点:“随着时间的推移,经济学必须越来越多地关注调节人类社会行为的机器的设计。网络信息系统比政策更直接、更详细、更直观地指导人们。换句话说,经济学必须变成大规模、系统化的用户界面设计”。
设计算法和人类共同做出更好决策的组织将是这一议程的重要组成部分。
致谢
这篇博客受益于 Geoff Mulgan 的评论,并受到与 John Davies 对话的启发。上图表示多标签分类问题中的精确召回率曲线。它显示了当设置不同的规则(概率阈值)将观察结果归类时,随机森林分类算法容易出错。
附录:关于算法决策的三个经济学小故事
以下三个小插图是算法决策情况的非常简化的形式化。我的主要灵感来自乔·斯蒂格利茨和拉吉·萨赫 1985 年发表的一篇论文《人类易犯错误和经济组织》,其中作者模拟了两种组织设计——等级制 海外华人资料 和“多头政治”(扁平组织)——如何应对人为错误。他们的分析表明,在等级制组织中,决策者在层级较低的人监督下,往往会拒绝更多好项目,而在多头政治中,代理人彼此独立决策,往往会接受更多坏项目。从他们的模型中可以得出一个重要的教训,那就是错误是不可避免的,最佳组织设计取决于具体情况。
案例 1:算法说也许
假设有一家在线视频公司,将广告与目录中的视频进行匹配。该公司拥有数百万个视频,因此依靠人力来完成这项工作在经济上是不可行的。相反,其数据科学家开发了算法来自动完成这项工作。[16]该公司寻找能够最大化匹配决策预期值的算法。该值取决于三个因素:[17]
为了简化事情,我做了一些假设:组织希望保持 k 不变,并且随着 n 的增加,奖励 r 和惩罚 p 保持不变。[20]
这样我们就得到了两个随着 n 的增加而变化的变量:a 和 C。
我认为算法准确率会随着决策数量的增加而下降,因为降低准确率的过程比提高准确率的过程更强
我假设生产成本 C 仅取决于数据科学家和主管的劳动。这两个职业的工资分别为 wds 和 ws。
基于此,以及一些计算,随着我们做出更多决策,我们可以得到预期收益的变化,如下所示:
这意味着,随着决策的增多,预期总收益会以某种方式增长,而这种增长会受到算法边际准确度变化的影响。一方面,决策增多意味着决策更正确,收益也会随之增加。另一方面,准确度的下降会导致错误和惩罚增多。其中一些错误和惩罚会由人类监督者抵消。