顶级模型免费开放，攻击AI暗网泛滥：AI平权如何撕裂安全防线？

上周末有两则AI圈的消息，放在一起看很有意思。一边是美团旗下AI助手Tabbit国际版宣布免费集成GPT-4o等顶级大模型，用户无需付费就能调用媲美ChatGPT Plus的核心能力。另一边，暗网市场上新出现的无道德限制大模型WormGPT完成一次重要迭代，其生成的钓鱼邮件已经让多家金融机构的内部安全测试败下阵来。看似无关的两件事，其实指向了同一个正在加速的深层变化。

Tabbit免费化的真正信号

很多人把Tabbit国际版这次动作简单理解为“补贴拉新”，但远不止于此。它直接集成了GPT-4o、Claude 3.5等最新模型，不设每日调用上限，也不需要用户绑定信用卡。这在半年前还难以想象——彼时企业还在为每千个token的报价精打细算，如今顶级能力竟成了免费入口的标配。

这背后是模型成本的剧烈坍缩。OpenAI和Anthropic持续压低API价格，开源阵营的Llama 3、Qwen 2在多项基准测试中已逼近闭源旗舰。当模型推理成本降到几乎可以忽略时，科技公司正在用“超级应用化”的思路将AI包裹进外卖、出行、办公等场景，让用户无感地使用最强大脑。

美团不是孤例。同样在上周，微软将Copilot深度嵌入免费版Office网页应用，字节跳动把豆包大模型装入飞书的基础版套餐。顶级大模型的能力正以超出大多数人预期的速度，穿过定价围墙，涌入普通用户的指尖。这当然是好事——AI不再是少数人的特权，技术民主化从来都值得欢呼。

可硬币的另一面，正是这种低成本、高可用性的另一群“用户”——网络攻击者。

暗网里长出的“无缰AI”

就在Tabbit宣布免费的同一天，安全研究机构SlashNext发布了一份报告，追踪到暗网工具WormGPT的最新变种。它基于开源大模型精调而成，删除了所有安全对齐，能批量生成高度针对性的商务邮件欺诈话术，甚至能模仿特定高管的写作风格。测试显示，由它生成的钓鱼邮件让受训安全意识员工的点击率上升了37%。

这不是孤例。去年FraudGPT、Evil-GPT等工具相继出现，今年又涌现出能自动寻找漏洞的HackGPT、能实时生成免杀恶意代码的BlackMamba。它们无一例外都站在了免费开源大模型的肩膀上。攻击者不需要从头训练模型，只需下载一个Llama或Mistral的开放权重，用极少的数据做微调，就能打造完全听从恶意指令的“犯罪副驾驶”。

传统网络安全的护城河建立在信息与工具的不对等上：攻击者需要较高技术门槛才能编写高级恶意软件、策划精密的社会工程攻击。但攻击性AI把这道门槛踩到了地板上。一个没有编程基础的骗子，现在用自然语言就能生成接近零检出率的恶意文档，成本不过是几十美元的推理算力。

安全模型正在被“供给侧”瓦解

当我们习惯于用“降本增效”来赞美AI普及时，常常忘记攻击者同样享受这份红利。过去企业花重金部署邮件安全网关、终端检测系统，依赖的是攻击手法更新速度远慢于防御规则迭代速度这一前提。但AI打破了这一平衡——攻击者可以实时生成全新语义的钓鱼文案，每个变种都独一无二，让基于签名和规则的防御体系瞬间过时。

更令人不安的是多模态攻击的兴起。研究机构DeepMind的安全团队最近演示了一种攻击路径，利用开源多模态模型将恶意指令隐藏在图片的不可见像素中，前端AI助手在解析图片时自动执行任务。当Tabbit这类集成多模态能力的应用广泛开放，类似攻击面就被指数级放大。普通用户还在兴奋于AI识图翻译的便利，攻击者已经在测试多少种方式可以绕过内容审核注入恶意指令。

这揭示了一个残酷的反讽：大模型安全对齐的努力，正在被开源和免费化浪潮悄悄瓦解。科技公司投入数十亿美元确保闭源模型“不作恶”，但开源社区里任何人都可以剥离安全层，甚至故意训练出完全服从恶意指令的模型。当顶级模型的能力以近乎零门槛的方式释放，作恶的成本远比从零构建低得多。

从漏洞扫描到“认知渗透”

如果我们把视线从钓鱼邮件上移开，会看到更深层的威胁。攻击性AI正在从工具层面上升到策略层面，从单纯的漏洞利用进化到对组织决策过程的认知渗透。举例来说，威胁行为者现在可以用大模型批量抓取目标公司高管的公开言论，自动生成高度个性化的虚假商业合作邮件，再配合AI生成的深度伪造语音进行多轮“预热”沟通。

这种攻击不再是传统的单点突破，而是一个持续的低强度认知战过程。它不直接触碰技术防火墙，而是绕过防线攻击人脑的信任机制。当Gartner预测到2027年全球将有超过40%的社会工程攻击由AI全流程驱动时，我们面对的不再是“电脑被黑”，而是整个商业信任体系的底层被悄然侵蚀。

这意味着，防御方的护城河必须从网络边界延伸到认知层。但现实是，大多数企业连员工AI安全培训都还没提上日程，更不用说用AI来实时检测语义层的社交工程攻击。

同一场洪流的两岸

把Tabbit免费化和WormGPT迭代放在同一个镜框里，我们看到的其实是同一场洪流的两岸。左岸是科技公司推动的“AI everywhere”愿景，让模型像水电网一样无处不在、随手可得；右岸是攻击者在同一片水域中更早学会了冲浪，利用便捷廉价的能力构筑起新型犯罪流水线。洪流本身没有善恶，但它会先淹没建得不够高的堤坝。

有朋友问我，这是不是意味着呼吁科技公司放慢开源和免费化的脚步。恰好相反。收紧访问权限只会让黑产转向自建模型，而合法用户被挡在墙外并不会削弱攻击者的能力——他们从不缺获取工具的渠道。真正需要做的是让防御侧的AI同样实现低成本、高普及，并且跑得更快。

我们看到一些好的苗头。已经有创业公司专门训练“反社会工程AI”，在邮件客户端本地运行时检测语义异常；也有安全团队基于开源模型开发了可私有化部署的威胁狩猎智能体，能模拟攻击者思维预判入侵路径。但这些努力还远远不够，防御方需要像美团推Tabbit那样，把AI安全能力也变成唾手可得的公共服务。

裂缝中透出的新规则

我始终相信，技术史反复印证一个规律：每一次能力的下放都会引发阵痛期，但最终会催生出更健壮的系统。当攻击性AI把传统安全护城河冲开裂缝时，正是重建下一代安全架构的时机。未来的网络安全竞争不会发生在静态的边界上，而是一场AI对AI的动态博弈——谁能以更低成本、更快速度进化认知防御能力，谁就能守住阵地。

这个转折点不会太远。也许到明年此时，我们会像今天讨论邮件过滤那样自然地谈论“AI协同免疫系统”，会习惯所有终端都内置一个对抗攻击AI的本地模型。而像Tabbit这样连接亿万用户的应用，假如在免费集成强大模型的同时，也把AI驱动的前置安全检测做成默认选项，那就真的在缝合这道撕裂的防线。

对普通用户来说，享受免费尖端AI时多留一分警惕，也许比任何技术方案都更重要。毕竟在这条洪流里，学会看清水下的暗流，才是上岸的第一步。

Aiii人工智能创研院(Aiii.org.cn)精选文章《顶级模型免费开放，攻击AI暗网泛滥：AI平权如何撕裂安全防线？》文中所述为作者独立观点，不代表Aiii人工智能创研院立场。如有侵权请联系删除。如若转载请注明出处：https://www.aiii.org.cn/765.html

顶级模型免费开放，攻击AI暗网泛滥：AI平权如何撕裂安全防线？

Tabbit免费化的真正信号

暗网里长出的“无缰AI”

安全模型正在被“供给侧”瓦解

从漏洞扫描到“认知渗透”

同一场洪流的两岸

裂缝中透出的新规则

关于作者

主编

发表回复

顶级模型免费开放，攻击AI暗网泛滥：AI平权如何撕裂安全防线？

Tabbit免费化的真正信号

暗网里长出的“无缰AI”

安全模型正在被“供给侧”瓦解

从漏洞扫描到“认知渗透”

同一场洪流的两岸

裂缝中透出的新规则

关于作者

主编

相关推荐

发表回复