当算法开始用数据筛选命运，我们的公平还能信谁

你可能有过这样的经历：投出几十份简历，却连一通电话都没等到。也许你会觉得，是自己不够优秀。但真相可能更荒诞——拒绝你的不是人，而是一套不懂“人”为何物的算法，它甚至可能在几毫秒内就因为你的名字、毕业院校或居住区域，判了你职业发展的“死刑”。这不是科幻情节。近期，一项覆盖340万人的大规模实地研究，揭开了AI招聘黑箱里的隐秘一角，让我们不得不面对一个棘手的事实：当机器开始“决定”人的命运，它带来的系统性幻觉，可能比人类最深的偏见更隐蔽也更危险。

一、340万人的实证：AI的偏见不是意外，是常态

去年底，剑桥大学和哈佛大学的研究团队发布了一项震撼业界的报告。研究人员在15个国家开展实验，将逾340万份真实简历投向使用主流AI招聘工具的企业，结果令人脊背发凉。同一份简历，仅仅因为求职者名字暗示的种族不同，进入面试的概率出现了高达40%的差异。在某些工具面前，带有非洲裔或拉丁裔特征名字的候选人，被系统直接降权，而白人特征名字则被显著推荐。

更让人心惊的是，这种歧视并非偶然波动。研究追踪了多款市占率领先的AI招聘软件，其中不乏财富500强企业的常用工具。比如某知名平台倾向推荐“曾在大公司实习”的候选者，而这类经验在少数族裔群体中本就稀缺。算法学到的不是“能力”，而是历史上不平等分配的机会结构。数据喂养出偏见，偏见又通过算法放大，变成了一道横亘在公平面前的技术高墙。

二、它只是忠实地复刻了人类的坏习惯

很多人会为AI开脱：机器没有主观恶意，它只是在数据中寻找规律。问题恰恰出在这里。当训练数据来自充满歧视的人类决策史时，AI就会成为这只“看不见的手”最忠实的学徒。招聘工具往往会用过往员工绩效作为标签，但如果一家公司过去五年录用的多数是男性白人，模型便会认定“男性+白人”是成功的特征，从而在筛简历时主动淘汰其他群体。

亚马逊曾在2015年发现自家研发的AI招聘引擎严重歧视女性。分析显示，系统学会了惩罚简历中包含“女子学院”“女子社团”等词汇的申请者。尽管工程师试图修正，但大模型早已把整个技术行业的性别失衡结构内化为评分参数。最终，亚马逊不得不关停该项目。这并非孤例。任何基于历史数据训练的预测模型，都天然地倾向于固化现有权力结构——用更冰冷、更不可辩驳的方式。

三、不只是工作：AI决策的“系统性幻觉”正在蔓延

招聘领域的发现只是一个切口。当算法介入医疗、信贷、司法甚至儿童保护等高风险决策时，它的“幻觉”就变得格外致命。所谓系统性幻觉，不是指偶尔的识别错误，而是模型在看似精确的概率计算下，系统性地生产出对某些群体有害的结果，并且用“客观”“科学”的外衣掩盖起来。

在美国，一款名为COMPAS的再犯风险评估工具曾被广泛应用在量刑和假释环节。调查报道发现，该算法将黑人被告错误地标示为高风险的概率几乎是白人的两倍，同时白人的低风险误判率也更高。算法给出的分数看起来只是不带感情的数字，但每一个小数点背后，都牵动着一个人的自由。再比如，研究表明某些医疗AI因为训练数据中黑人患者样本不足，导致对黑人病情严重程度的严重低估，可能延误救治。

这些问题的共同底层逻辑惊人一致：算法优化的目标并非“公平”，而是“准确率”或“效率”。在一个结构性的不平等里，高效率地复制偏见，恰好能达到最高的预测准确率。于是，AI成了一种极其高效的歧视放大器。

四、为什么我们更愿意相信一个有偏见的机器？

这就引出了一个更深的心理悖论：人类决策者同样带有偏见，但我们往往对机器的错误更加宽容，甚至更信任。心理学上称之为“自动化偏差”——人们倾向于默认自动化系统的判断为正确，即便有证据显示它犯错了。HR看到AI标记的“匹配度86%”时，会下意识松一口气，觉得终于有了科学依据。却很少有人追问，这86%里浸泡着多少不公平的历史。

机器的冰冷数字还制造了一种“责任分散”的幻觉。当企业拒绝一位求职者时，招聘专员可以说：“是系统淘汰的，我也没办法。”追责链条被切断，受害者甚至不知道敌人在哪里。算法变成了免罪金牌，人性中最深层的偏见被外包给了代码，而代码又由机器学习工程师团队在闭门造车中构建，缺乏外部监督。这种层层嵌套的不透明，让歧视得以在暗处滋生。

五、撕裂的监管与觉醒的个体

面对AI决策带来的风险，各国政府开始推出法规。欧盟《人工智能法案》将招聘、信贷等列为高风险应用，要求强制开展基本权利影响评估。美国纽约市2023年实施地方法律，强制要求AI招聘工具接受偏见审计，并公开审计结果。中国也明确要求算法推荐服务提供者应当防止歧视。然而，法规的落地远比想象中复杂。

很多企业以“商业机密”为由拒绝公开模型细节，审查机构缺乏技术手段深入黑箱。同时，偏见测量本身就可能存在方法论争议：究竟该确保各个群体的机会完全均等，还是允许模型根据实际需求做出合理区分？这些问题没有简单答案。但至少，大规模的曝光研究正在唤醒公众意识。求职者开始主动追问企业：“你们的AI经过公平审计吗？”一些走在前沿的公司已主动引入“算法伦理官”，在模型上线前进行红队测试，用特定偏见用例反复攻击模型，提前发现歧视。

六、找回人的温度，也找回人的判断

技术从来不是价值中立的。当AI开始决定谁的简历通过、谁的贷款被拒，我们必须从“它能不能做到”转向“它该不该做”。有研究者提出“人回路”（human-in-the-loop）的必要性，即关键决策必须保留人类复核环节，尤其当模型给出边缘分数时，应当交由人类判断。

但这远非终点。人类复核者的偏见同样需要训练和监督，否则容易沦为形式主义。更深层的解药，或许在于重新设计评价体系：与其教AI识别“好员工”的过往，不如定义我们想要的未来。比如在招聘中减少对名校、大厂背景的过度依赖，增加技能测试和潜力评估。当数据本身就不公正时，最诚实的算法也难逃偏见。

340万人的实证如一记重锤，敲醒了我们对技术乌托邦的幻想。AI决策的系统性幻觉提醒我们，使用智能工具的同时，绝不能放下人的批判性思维。因为任何算法都无法替代一个基本问题：我们究竟想构建一个怎样的社会？那个答案不在代码里，而在我们每一个被算法审视，也审视算法的普通人的手中。

Aiii人工智能创研院(Aiii.org.cn)精选文章《当算法开始用数据筛选命运，我们的公平还能信谁》文中所述为作者独立观点，不代表Aiii人工智能创研院立场。如有侵权请联系删除。如若转载请注明出处：https://www.aiii.org.cn/780.html

当算法开始用数据筛选命运，我们的公平还能信谁

一、340万人的实证：AI的偏见不是意外，是常态

二、它只是忠实地复刻了人类的坏习惯

三、不只是工作：AI决策的“系统性幻觉”正在蔓延

四、为什么我们更愿意相信一个有偏见的机器？

五、撕裂的监管与觉醒的个体

六、找回人的温度，也找回人的判断

关于作者

主编

发表回复

当算法开始用数据筛选命运，我们的公平还能信谁

一、340万人的实证：AI的偏见不是意外，是常态

二、它只是忠实地复刻了人类的坏习惯

三、不只是工作：AI决策的“系统性幻觉”正在蔓延

四、为什么我们更愿意相信一个有偏见的机器？

五、撕裂的监管与觉醒的个体

六、找回人的温度，也找回人的判断

关于作者

主编

相关推荐

发表回复