当算法开始用数据筛选命运,我们的公平还能信谁

剑桥与哈佛联合研究揭示,AI招聘工具导致不同种族名字求职者面试机会相差40%,亚马逊曾因歧视关停自研引擎。算法复制历史偏见,COMPAS再犯评估系统误判黑人风险为白人两倍,医疗AI低估黑人病情。自动化偏差让人们更信任机器,责任分散加剧不透明。欧盟、纽约等地立法要求偏见审计,但商业机密阻碍监管。文章指出,AI决策的系统性幻觉需要人类批判性思维介入,重新设计评价体系,保留人回路复核,追问社会公平本质。

当算法开始用数据筛选命运,我们的公平还能信谁

你可能有过这样的经历:投出几十份简历,却连一通电话都没等到。也许你会觉得,是自己不够优秀。但真相可能更荒诞——拒绝你的不是人,而是一套不懂“人”为何物的算法,它甚至可能在几毫秒内就因为你的名字、毕业院校或居住区域,判了你职业发展的“死刑”。这不是科幻情节。近期,一项覆盖340万人的大规模实地研究,揭开了AI招聘黑箱里的隐秘一角,让我们不得不面对一个棘手的事实:当机器开始“决定”人的命运,它带来的系统性幻觉,可能比人类最深的偏见更隐蔽也更危险。

一、340万人的实证:AI的偏见不是意外,是常态

去年底,剑桥大学和哈佛大学的研究团队发布了一项震撼业界的报告。研究人员在15个国家开展实验,将逾340万份真实简历投向使用主流AI招聘工具的企业,结果令人脊背发凉。同一份简历,仅仅因为求职者名字暗示的种族不同,进入面试的概率出现了高达40%的差异。在某些工具面前,带有非洲裔或拉丁裔特征名字的候选人,被系统直接降权,而白人特征名字则被显著推荐。

更让人心惊的是,这种歧视并非偶然波动。研究追踪了多款市占率领先的AI招聘软件,其中不乏财富500强企业的常用工具。比如某知名平台倾向推荐“曾在大公司实习”的候选者,而这类经验在少数族裔群体中本就稀缺。算法学到的不是“能力”,而是历史上不平等分配的机会结构。数据喂养出偏见,偏见又通过算法放大,变成了一道横亘在公平面前的技术高墙。

二、它只是忠实地复刻了人类的坏习惯

很多人会为AI开脱:机器没有主观恶意,它只是在数据中寻找规律。问题恰恰出在这里。当训练数据来自充满歧视的人类决策史时,AI就会成为这只“看不见的手”最忠实的学徒。招聘工具往往会用过往员工绩效作为标签,但如果一家公司过去五年录用的多数是男性白人,模型便会认定“男性+白人”是成功的特征,从而在筛简历时主动淘汰其他群体。

亚马逊曾在2015年发现自家研发的AI招聘引擎严重歧视女性。分析显示,系统学会了惩罚简历中包含“女子学院”“女子社团”等词汇的申请者。尽管工程师试图修正,但大模型早已把整个技术行业的性别失衡结构内化为评分参数。最终,亚马逊不得不关停该项目。这并非孤例。任何基于历史数据训练的预测模型,都天然地倾向于固化现有权力结构——用更冰冷、更不可辩驳的方式。

三、不只是工作:AI决策的“系统性幻觉”正在蔓延

招聘领域的发现只是一个切口。当算法介入医疗、信贷、司法甚至儿童保护等高风险决策时,它的“幻觉”就变得格外致命。所谓系统性幻觉,不是指偶尔的识别错误,而是模型在看似精确的概率计算下,系统性地生产出对某些群体有害的结果,并且用“客观”“科学”的外衣掩盖起来。

在美国,一款名为COMPAS的再犯风险评估工具曾被广泛应用在量刑和假释环节。调查报道发现,该算法将黑人被告错误地标示为高风险的概率几乎是白人的两倍,同时白人的低风险误判率也更高。算法给出的分数看起来只是不带感情的数字,但每一个小数点背后,都牵动着一个人的自由。再比如,研究表明某些医疗AI因为训练数据中黑人患者样本不足,导致对黑人病情严重程度的严重低估,可能延误救治。

这些问题的共同底层逻辑惊人一致:算法优化的目标并非“公平”,而是“准确率”或“效率”。在一个结构性的不平等里,高效率地复制偏见,恰好能达到最高的预测准确率。于是,AI成了一种极其高效的歧视放大器。

四、为什么我们更愿意相信一个有偏见的机器?

这就引出了一个更深的心理悖论:人类决策者同样带有偏见,但我们往往对机器的错误更加宽容,甚至更信任。心理学上称之为“自动化偏差”——人们倾向于默认自动化系统的判断为正确,即便有证据显示它犯错了。HR看到AI标记的“匹配度86%”时,会下意识松一口气,觉得终于有了科学依据。却很少有人追问,这86%里浸泡着多少不公平的历史。

机器的冰冷数字还制造了一种“责任分散”的幻觉。当企业拒绝一位求职者时,招聘专员可以说:“是系统淘汰的,我也没办法。”追责链条被切断,受害者甚至不知道敌人在哪里。算法变成了免罪金牌,人性中最深层的偏见被外包给了代码,而代码又由机器学习工程师团队在闭门造车中构建,缺乏外部监督。这种层层嵌套的不透明,让歧视得以在暗处滋生。

五、撕裂的监管与觉醒的个体

面对AI决策带来的风险,各国政府开始推出法规。欧盟《人工智能法案》将招聘、信贷等列为高风险应用,要求强制开展基本权利影响评估。美国纽约市2023年实施地方法律,强制要求AI招聘工具接受偏见审计,并公开审计结果。中国也明确要求算法推荐服务提供者应当防止歧视。然而,法规的落地远比想象中复杂。

很多企业以“商业机密”为由拒绝公开模型细节,审查机构缺乏技术手段深入黑箱。同时,偏见测量本身就可能存在方法论争议:究竟该确保各个群体的机会完全均等,还是允许模型根据实际需求做出合理区分?这些问题没有简单答案。但至少,大规模的曝光研究正在唤醒公众意识。求职者开始主动追问企业:“你们的AI经过公平审计吗?”一些走在前沿的公司已主动引入“算法伦理官”,在模型上线前进行红队测试,用特定偏见用例反复攻击模型,提前发现歧视。

六、找回人的温度,也找回人的判断

技术从来不是价值中立的。当AI开始决定谁的简历通过、谁的贷款被拒,我们必须从“它能不能做到”转向“它该不该做”。有研究者提出“人回路”(human-in-the-loop)的必要性,即关键决策必须保留人类复核环节,尤其当模型给出边缘分数时,应当交由人类判断。

但这远非终点。人类复核者的偏见同样需要训练和监督,否则容易沦为形式主义。更深层的解药,或许在于重新设计评价体系:与其教AI识别“好员工”的过往,不如定义我们想要的未来。比如在招聘中减少对名校、大厂背景的过度依赖,增加技能测试和潜力评估。当数据本身就不公正时,最诚实的算法也难逃偏见。

340万人的实证如一记重锤,敲醒了我们对技术乌托邦的幻想。AI决策的系统性幻觉提醒我们,使用智能工具的同时,绝不能放下人的批判性思维。因为任何算法都无法替代一个基本问题:我们究竟想构建一个怎样的社会?那个答案不在代码里,而在我们每一个被算法审视,也审视算法的普通人的手中。

Aiii人工智能创研院(Aiii.org.cn)精选文章《当算法开始用数据筛选命运,我们的公平还能信谁》文中所述为作者独立观点,不代表Aiii人工智能创研院立场。如有侵权请联系删除。如若转载请注明出处:https://www.aiii.org.cn/780.html

(1)
打赏 微信公众号 微信公众号 微信小助理 微信小助理
AI编码高分的背后:基准测试正在沦为另一种应试教育
上一篇 1天前
当你的Slack里住着一个AI同事,它正在吃掉软件业
下一篇 4天前

相关推荐

发表回复

登录后才能评论
小编
分享本页
返回顶部