【编者按】2025年,中国大模型赛道进入”应用深水区”。当行业焦点从参数竞赛转向效率革命,阶跃星辰的Step3.5Flash以”小参数、高性能”的差异化路径引发关注。这款模型如何在有限算力预算下实现越级表现?其技术哲学与行业主流的ScalingLaw有何不同?面向2026年,阶跃星辰又将如何定义下一代智能?
近日,我们专访了阶跃星辰技术负责人(应受访者要求,隐去具体姓名),就Step3.5Flash的研发逻辑、技术路线选择及2026年攻坚方向进行了深入交流。以下为专访实录,经编辑整理。
一、关于Step3.5Flash:我们为何选择”非对称作战”
Q:Step3.5Flash发布时,行业正陷入”参数军备竞赛”,GPT-4、Kimik1.5等模型都在追求万亿参数规模。你们为何反其道而行之,专注于中小参数的极致优化?
技术负责人:这其实是被”算力现实”教育后的清醒选择。2024年初,我们内部做过一次压力测试:如果按照行业主流的Dense模型路线继续Scaling,到年底我们的推理成本将占营收的60%以上。这不是商业模式问题,而是生存问题。
更关键的是观察到了”能力饱和”现象。我们发现,当模型参数超过一定阈值(大约在300B-500B区间),在特定任务上的边际收益急剧递减,但推理延迟却线性上升。对于金融风控、实时客服、端侧智能这些场景,用户要的不是”全能博士”,而是”专科专家”,而且必须是反应极快的那种。
Step3.5Flash的定位因此非常明确:在100B-200B参数区间,实现接近千亿级模型的核心能力,同时将推理成本降低一个数量级。这不是妥协,而是精准打击。
Q:具体采用了哪些技术手段实现这一目标?
技术负责人:三个核心创新点。
第一,动态稀疏激活(DynamicSparseActivation)。传统MoE(混合专家)模型是”静态路由”,每个Token固定激活Top-K个专家。我们开发了任务感知的动态路由机制,根据输入内容的复杂度实时调整激活专家的数量和组合。简单查询可能只激活5%的参数,复杂推理才启用全量。这相当于给模型装了一个”智能油门”。
第二,知识蒸馏的”逆向工程”。常规蒸馏是用大模型教小模型,但我们发现这种”填鸭式”蒸馏会损失小模型的探索能力。我们的做法是”对抗式蒸馏”,让小模型在特定领域(如数学推理、代码生成)与大模型”辩论”,只保留那些小模型通过自身推理验证过的知识。这保证了轻量化的同时不损失逻辑深度。
第三,硬件协同设计(Hardware-CoDesign)。我们与国产芯片厂商深度合作,针对Step3.5Flash的稀疏计算特性优化了底层算子。这不是简单的”模型压缩”,而是从算法架构到芯片指令集的全栈重构。最终我们在昇腾910B上的推理效率比同等参数规模的通用模型高出40%。
二、技术路线之争:我们为什么不相信”唯ScalingLaw”
Q:你们的技术路线似乎与OpenAI、DeepSeek等坚持的”ScalingLaw至上”有所分歧。如何看待这种分歧?
技术负责人:首先必须澄清,我们完全不否认ScalingLaw的有效性。问题在于,ScalingLaw描述的是”可能性边界”,而非”最优解路径”。
当前行业有一个危险倾向:将ScalingLaw异化为”算力拜物教”,认为只要堆够卡、喂够数据,智能就会自然涌现。这种思维忽略了两个现实约束:
- 一是数据质量的边际递减。互联网可获取的高质量文本数据正在枯竭。2024年的研究显示,重复数据对模型能力的提升贡献为负。这意味着”大力出奇迹”的阶段正在过去,未来属于”数据精炼”能力。
- 二是应用场景的异质性。通用大模型是”瑞士军刀”,但产业需要的是”手术刀”。金融场景需要极强的数值精确性和可解释性,制造业需要多模态的实时感知,端侧应用要求极致的能效比。这些需求无法通过单一超大模型满足,必须发展”模型家族”(ModelFamily)策略。
Step3.5Flash是我们模型家族中的”轻骑兵”。在它之上,我们有Step3.5Turbo处理复杂任务,Step3.5Ultra应对多模态场景,还有正在研发的Step4探索前沿能力。用军事术语比喻,我们建设的是”合成旅”而非”单一王牌师”。
Q:这种路线选择是否意味着中国大模型厂商在算力受限环境下的”被迫创新”?
技术负责人:客观限制确实加速了决策,但主观选择同样关键。即使拥有无限算力,我们仍会发展高效小模型,因为”智能密度”(IntelligenceDensity)才是终极竞争力。
想象两个场景:A模型需要10000张H100才能训练,部署时需要专用机房;B模型只需1000张卡,能跑在边缘服务器甚至高端手机上。如果B在90%的场景达到A的95%能力,那么B的实际商业价值可能远超A。这就是智能密度的胜利,单位算力消耗所能交付的智能服务量。
2025年的行业共识正在形成:模型能力差距在缩小,但工程化能力和成本效率差距在拉大。后者才是决定商业化成败的关键。
三、关于开源与生态:我们为何选择”半开放”策略
Q:阶跃星辰在开源策略上相对谨慎,Step3.5Flash目前仅提供API而非模型权重。这与DeepSeek、阿里等厂商的激进开源形成对比,背后有何考量?
技术负责人:这涉及我们对”开源”本质的理解。当前大模型领域的开源,大致分为三个层次:
L1是”代码开源”,如早期PyTorch、TensorFlow,开放的是工具框架;L2是”模型开源”,如Llama、Qwen,开放的是权重文件;L3是”能力开源”,开放的是可复用的智能服务接口。
我们选择L3路径,基于两点判断:
- 第一,模型权重的开放在当前监管环境下风险与收益不匹配。大模型具有”双重用途”特性,同一套权重既可用于客服机器人,也可被微调用于深度伪造或自动化攻击。在缺乏有效溯源机制的情况下,完全开源可能带来不可控的滥用。
- 第二,API模式更能保障用户体验的一致性。我们发现,即使是相同的基础模型,不同的微调方式和部署环境会导致输出质量剧烈波动。通过API提供服务,我们可以持续优化推理引擎、安全过滤和后处理流程,确保终端用户获得稳定可靠的体验。
但这不意味着封闭。我们推出了”阶跃星链”计划,向合作伙伴开放模型微调接口、领域知识注入工具链和私有化部署方案。本质上,我们开放的是”智能能力”而非”模型本体”,是”服务接口”而非”物理文件”。
Q:如何看待DeepSeek等开源厂商带来的生态压力?
技术负责人:竞争是好事,它证明了市场活力。但我们需要区分”开源营销”和”开源生态”。
某些厂商的开源更多是市场获客手段,通过开放权重吸引开发者试用,最终引导至其云服务。这种模式下,开源社区的实际贡献度和可持续性存疑。真正的开源生态应该像Linux或HuggingFace那样,有清晰的治理结构、持续的社区贡献和去中心化的创新网络。
我们的策略是”先筑护城河,再逐步开放”。当前阶段,我们更关注与头部企业建立深度合作关系,在金融、汽车、智能终端等领域打磨垂直解决方案。当这些场景验证成熟后,我们会考虑以更有序的方式开放部分技术能力。
四、2026攻坚方向:从”语言智能”到”行动智能”
Q:展望2026年,阶跃星辰的技术攻坚重点是什么?
技术负责人:三个战略级方向。
第一,多模态原生架构(NativeMultimodality)。当前的多模态大模型大多是”拼接式”的,视觉编码器+语言模型+音频模块。这种架构存在信息损耗和延迟问题。我们正在研发真正意义上的多模态原生模型,从底层架构统一处理文本、图像、视频、音频甚至传感器数据。目标是实现”毫秒级”的多模态理解与生成,支撑自动驾驶、机器人控制等实时场景。
第二,推理能力的”神经符号融合”。大模型的”幻觉”问题根源在于其概率性本质。我们探索将神经网络的模式识别能力与符号系统的逻辑严谨性结合,让模型在需要精确推理时(如数学证明、法律分析),能够调用外部符号引擎进行验证,而非单纯依赖参数记忆。Step3.5Flash中已经试点了轻量级符号约束模块,2026年将实现更深度的融合。
第三,也是最具野心的方向,”行动智能”(ActionIntelligence)。当前大模型主要是”思考者”,但下一代AI必须是”行动者”。我们正与机器人厂商合作,开发能够理解物理世界、规划行动序列、执行复杂任务的具身智能模型。这不是简单的”大模型+机械臂”,而是要从感知-认知-决策-控制的全链路重构AI与物理世界的交互方式。
Q:这听起来像是通往AGI的路径。你们如何定义AGI,以及预计的时间表?
技术负责人:我们内部避免使用AGI这个术语,因为它太模糊且容易被炒作。我们更关注”经济价值拐点”,AI在多大程度上能够自主完成具有经济价值的复杂任务链。
按照这一标准,2025-2026年将是”垂直领域自主智能”的突破期:一个AI系统能够独立处理从需求分析、方案设计到执行监控的完整项目流程,仅在关键节点请求人类确认。这不是科幻,而是正在发生的工程现实。
至于所谓的”超级智能”,我认为至少还需要5-10年的技术积累,且必须伴随重大的理论突破,可能是新的学习范式,可能是神经科学与AI的深度交叉,也可能是量子计算的实用化。在此之前,务实的渐进式创新比激进的AGI叙事更有价值。
五、关于中国大模型产业:冷静与信心
Q:最后,如何看待中国大模型产业在全球竞争中的位置?
技术负责人:需要同时保持冷静和信心。
冷静的一面是:在基础算法创新、高端算力芯片、顶级AI人才密度等”硬指标”上,我们与美国顶尖机构仍有差距。这种差距不是短期内能抹平的,也不应该通过”弯道超车”的叙事来掩盖。
信心的一面是:中国在应用场景丰富度、数据规模、工程化落地速度上具有独特优势。当美国还在争论AI安全伦理时,我们的模型已经在工厂、农田、医院产生实际价值。这种”应用驱动创新”的模式,可能催生出不同于美国的技术演进路径。
Step3.5Flash就是一个例子,它不是为了在学术榜单上刷分,而是为了解决中国企业”用得起、用得好AI”的真实痛点。如果这种”问题导向”的创新能够持续积累,中国完全有可能在特定领域定义下一代AI标准。
最终,技术竞争是马拉松而非百米冲刺。2024年的”百模大战”只是热身,真正的较量将在2026-2028年展开,那时模型能力将接近人类专家水平,应用场景将全面铺开,商业模式将趋于清晰。阶跃星辰的目标,是在那场较量中成为不可或缺的”中国力量”。
Aiii人工智能创研院(Aiii.org.cn)精选文章《专访阶跃星辰技术负责人:Step 3.5 Flash的研发逻辑与2026攻坚方向》文中所述为作者独立观点,不代表Aiii人工智能创研院立场。如有侵权请联系删除。如若转载请注明出处:https://www.aiii.org.cn/236.html

微信小程序