机器学习 (ML) 在解决我们最棘手的健康、教育和可持续发展问题方面的潜力尚未得到充分发挥。我们可以从其他大规模应用 ML 的行业中学到什么,了解哪些事情该做,哪些事情不该做?
去年,英国研究实验室 DeepMind宣布其人工智能系统 AlphaFold 2 能够以前所未有的准确度预测蛋白质的 3D 结构。这一突破有望推动药物研发和环境应用的快速发展。
与当今几乎所有的人工智能系统一样,AlphaFold 2 基于机器学习技术,该技术可以从数据中学习并做出预测。这些“预测机器”是我们每天使用的互联网产品和服务的核心,从搜索引擎和社交网络到个人助理和在线商店。未来几年,机器学习有望改变其他行业,包括交通运输(通过自动驾驶汽车)、生物医学研究(通过精准医疗)和制造业(通过机器人技术)。
但是,健康生活、早期发展或可持续发展等领域呢?我们的社会在这些领域面临着一些最大的挑战。预测性机器学习技术也可以在这些领域发挥重要作用——帮助识别有落后风险的学生,或通过个性化干预措施鼓励更健康的行为。然而,它在这些领域的潜力还远未实现。
“为什么我们能够开发机器学习技术来了解蛋白质的结构,却不能帮助社会工作者识别和支持处于危险中的儿童?”
例如,儿童社会关怀中心最近发表的一篇论文测试了机器学习在儿童服务领域的准确性,结果表明,这些模型在识别高危儿童时表现不佳。在机器学习应用范围更广的公共服务领域,如刑事司法 孟加拉国电话号码数据 系统和警务,机器学习的使用引发了人们对少数群体和弱势群体的公平、正义和安全的担忧。
这种情况让我想起了美国经济学家理查德·纳尔逊在 1977 年出版的《月球与贫民窟》一书中提出的难题。他问道,为什么美国能够将宇航员送上月球,却无法解决其城市中的贫困和排斥问题。我们可以对机器学习提出类似的问题:为什么我们能够开发机器学习技术来了解蛋白质的结构并改变我们获取和与在线信息互动的方式,却无法帮助社会工作者识别和支持处于危险中的儿童?
这对于 Nesta 的数据分析实践来说是一个重要问题。在过去五年中,我们已将数据科学和机器学习应用于艺术、研究和创新政策以及技能和工作等领域。当我们开始制定新战略时,我们知道机器学习在推进 Nesta 雄心勃勃的使命方面发挥着重要作用 - 但我们仍有很多东西需要学习,了解其他领域哪些方法有效(哪些无效)。在本博客的其余部分,我将从已经部署机器学习并产生变革性(但并不总是积极)影响的领域中吸取一些教训,并考虑它们对 Nesta 数据分析实践的影响。