专访阶跃星辰技术负责人：Step 3.5 Flash的研发逻辑与2026攻坚方向

【编者按】2025年，中国大模型赛道进入”应用深水区”。当行业焦点从参数竞赛转向效率革命，阶跃星辰的Step3.5Flash以”小参数、高性能”的差异化路径引发关注。这款模型如何在有限算力预算下实现越级表现？其技术哲学与行业主流的ScalingLaw有何不同？面向2026年，阶跃星辰又将如何定义下一代智能？

近日，我们专访了阶跃星辰技术负责人（应受访者要求，隐去具体姓名），就Step3.5Flash的研发逻辑、技术路线选择及2026年攻坚方向进行了深入交流。以下为专访实录，经编辑整理。

一、关于Step3.5Flash：我们为何选择”非对称作战”

Q：Step3.5Flash发布时，行业正陷入”参数军备竞赛”，GPT-4、Kimik1.5等模型都在追求万亿参数规模。你们为何反其道而行之，专注于中小参数的极致优化？

技术负责人：这其实是被”算力现实”教育后的清醒选择。2024年初，我们内部做过一次压力测试：如果按照行业主流的Dense模型路线继续Scaling，到年底我们的推理成本将占营收的60%以上。这不是商业模式问题，而是生存问题。

更关键的是观察到了”能力饱和”现象。我们发现，当模型参数超过一定阈值（大约在300B-500B区间），在特定任务上的边际收益急剧递减，但推理延迟却线性上升。对于金融风控、实时客服、端侧智能这些场景，用户要的不是”全能博士”，而是”专科专家”，而且必须是反应极快的那种。

Step3.5Flash的定位因此非常明确：在100B-200B参数区间，实现接近千亿级模型的核心能力，同时将推理成本降低一个数量级。这不是妥协，而是精准打击。

Q：具体采用了哪些技术手段实现这一目标？

技术负责人：三个核心创新点。

第一，动态稀疏激活（DynamicSparseActivation）。传统MoE（混合专家）模型是”静态路由”，每个Token固定激活Top-K个专家。我们开发了任务感知的动态路由机制，根据输入内容的复杂度实时调整激活专家的数量和组合。简单查询可能只激活5%的参数，复杂推理才启用全量。这相当于给模型装了一个”智能油门”。

第二，知识蒸馏的”逆向工程”。常规蒸馏是用大模型教小模型，但我们发现这种”填鸭式”蒸馏会损失小模型的探索能力。我们的做法是”对抗式蒸馏”，让小模型在特定领域（如数学推理、代码生成）与大模型”辩论”，只保留那些小模型通过自身推理验证过的知识。这保证了轻量化的同时不损失逻辑深度。

第三，硬件协同设计（Hardware-CoDesign）。我们与国产芯片厂商深度合作，针对Step3.5Flash的稀疏计算特性优化了底层算子。这不是简单的”模型压缩”，而是从算法架构到芯片指令集的全栈重构。最终我们在昇腾910B上的推理效率比同等参数规模的通用模型高出40%。

二、技术路线之争：我们为什么不相信”唯ScalingLaw”

Q：你们的技术路线似乎与OpenAI、DeepSeek等坚持的”ScalingLaw至上”有所分歧。如何看待这种分歧？

技术负责人：首先必须澄清，我们完全不否认ScalingLaw的有效性。问题在于，ScalingLaw描述的是”可能性边界”，而非”最优解路径”。

当前行业有一个危险倾向：将ScalingLaw异化为”算力拜物教”，认为只要堆够卡、喂够数据，智能就会自然涌现。这种思维忽略了两个现实约束：

一是数据质量的边际递减。互联网可获取的高质量文本数据正在枯竭。2024年的研究显示，重复数据对模型能力的提升贡献为负。这意味着”大力出奇迹”的阶段正在过去，未来属于”数据精炼”能力。
二是应用场景的异质性。通用大模型是”瑞士军刀”，但产业需要的是”手术刀”。金融场景需要极强的数值精确性和可解释性，制造业需要多模态的实时感知，端侧应用要求极致的能效比。这些需求无法通过单一超大模型满足，必须发展”模型家族”（ModelFamily）策略。

Step3.5Flash是我们模型家族中的”轻骑兵”。在它之上，我们有Step3.5Turbo处理复杂任务，Step3.5Ultra应对多模态场景，还有正在研发的Step4探索前沿能力。用军事术语比喻，我们建设的是”合成旅”而非”单一王牌师”。

Q：这种路线选择是否意味着中国大模型厂商在算力受限环境下的”被迫创新”？

技术负责人：客观限制确实加速了决策，但主观选择同样关键。即使拥有无限算力，我们仍会发展高效小模型，因为”智能密度”（IntelligenceDensity）才是终极竞争力。

想象两个场景：A模型需要10000张H100才能训练，部署时需要专用机房；B模型只需1000张卡，能跑在边缘服务器甚至高端手机上。如果B在90%的场景达到A的95%能力，那么B的实际商业价值可能远超A。这就是智能密度的胜利，单位算力消耗所能交付的智能服务量。

2025年的行业共识正在形成：模型能力差距在缩小，但工程化能力和成本效率差距在拉大。后者才是决定商业化成败的关键。

三、关于开源与生态：我们为何选择”半开放”策略

Q：阶跃星辰在开源策略上相对谨慎，Step3.5Flash目前仅提供API而非模型权重。这与DeepSeek、阿里等厂商的激进开源形成对比，背后有何考量？

技术负责人：这涉及我们对”开源”本质的理解。当前大模型领域的开源，大致分为三个层次：

L1是”代码开源”，如早期PyTorch、TensorFlow，开放的是工具框架；L2是”模型开源”，如Llama、Qwen，开放的是权重文件；L3是”能力开源”，开放的是可复用的智能服务接口。
我们选择L3路径，基于两点判断：

第一，模型权重的开放在当前监管环境下风险与收益不匹配。大模型具有”双重用途”特性，同一套权重既可用于客服机器人，也可被微调用于深度伪造或自动化攻击。在缺乏有效溯源机制的情况下，完全开源可能带来不可控的滥用。
第二，API模式更能保障用户体验的一致性。我们发现，即使是相同的基础模型，不同的微调方式和部署环境会导致输出质量剧烈波动。通过API提供服务，我们可以持续优化推理引擎、安全过滤和后处理流程，确保终端用户获得稳定可靠的体验。

但这不意味着封闭。我们推出了”阶跃星链”计划，向合作伙伴开放模型微调接口、领域知识注入工具链和私有化部署方案。本质上，我们开放的是”智能能力”而非”模型本体”，是”服务接口”而非”物理文件”。

Q：如何看待DeepSeek等开源厂商带来的生态压力？

技术负责人：竞争是好事，它证明了市场活力。但我们需要区分”开源营销”和”开源生态”。

某些厂商的开源更多是市场获客手段，通过开放权重吸引开发者试用，最终引导至其云服务。这种模式下，开源社区的实际贡献度和可持续性存疑。真正的开源生态应该像Linux或HuggingFace那样，有清晰的治理结构、持续的社区贡献和去中心化的创新网络。

我们的策略是”先筑护城河，再逐步开放”。当前阶段，我们更关注与头部企业建立深度合作关系，在金融、汽车、智能终端等领域打磨垂直解决方案。当这些场景验证成熟后，我们会考虑以更有序的方式开放部分技术能力。

四、2026攻坚方向：从”语言智能”到”行动智能”

Q：展望2026年，阶跃星辰的技术攻坚重点是什么？

技术负责人：三个战略级方向。

第一，多模态原生架构（NativeMultimodality）。当前的多模态大模型大多是”拼接式”的，视觉编码器+语言模型+音频模块。这种架构存在信息损耗和延迟问题。我们正在研发真正意义上的多模态原生模型，从底层架构统一处理文本、图像、视频、音频甚至传感器数据。目标是实现”毫秒级”的多模态理解与生成，支撑自动驾驶、机器人控制等实时场景。

第二，推理能力的”神经符号融合”。大模型的”幻觉”问题根源在于其概率性本质。我们探索将神经网络的模式识别能力与符号系统的逻辑严谨性结合，让模型在需要精确推理时（如数学证明、法律分析），能够调用外部符号引擎进行验证，而非单纯依赖参数记忆。Step3.5Flash中已经试点了轻量级符号约束模块，2026年将实现更深度的融合。

第三，也是最具野心的方向，”行动智能”（ActionIntelligence）。当前大模型主要是”思考者”，但下一代AI必须是”行动者”。我们正与机器人厂商合作，开发能够理解物理世界、规划行动序列、执行复杂任务的具身智能模型。这不是简单的”大模型+机械臂”，而是要从感知-认知-决策-控制的全链路重构AI与物理世界的交互方式。

Q：这听起来像是通往AGI的路径。你们如何定义AGI，以及预计的时间表？

技术负责人：我们内部避免使用AGI这个术语，因为它太模糊且容易被炒作。我们更关注”经济价值拐点”，AI在多大程度上能够自主完成具有经济价值的复杂任务链。

按照这一标准，2025-2026年将是”垂直领域自主智能”的突破期：一个AI系统能够独立处理从需求分析、方案设计到执行监控的完整项目流程，仅在关键节点请求人类确认。这不是科幻，而是正在发生的工程现实。

至于所谓的”超级智能”，我认为至少还需要5-10年的技术积累，且必须伴随重大的理论突破，可能是新的学习范式，可能是神经科学与AI的深度交叉，也可能是量子计算的实用化。在此之前，务实的渐进式创新比激进的AGI叙事更有价值。

五、关于中国大模型产业：冷静与信心

Q：最后，如何看待中国大模型产业在全球竞争中的位置？

技术负责人：需要同时保持冷静和信心。

冷静的一面是：在基础算法创新、高端算力芯片、顶级AI人才密度等”硬指标”上，我们与美国顶尖机构仍有差距。这种差距不是短期内能抹平的，也不应该通过”弯道超车”的叙事来掩盖。

信心的一面是：中国在应用场景丰富度、数据规模、工程化落地速度上具有独特优势。当美国还在争论AI安全伦理时，我们的模型已经在工厂、农田、医院产生实际价值。这种”应用驱动创新”的模式，可能催生出不同于美国的技术演进路径。

Step3.5Flash就是一个例子，它不是为了在学术榜单上刷分，而是为了解决中国企业”用得起、用得好AI”的真实痛点。如果这种”问题导向”的创新能够持续积累，中国完全有可能在特定领域定义下一代AI标准。

最终，技术竞争是马拉松而非百米冲刺。2024年的”百模大战”只是热身，真正的较量将在2026-2028年展开，那时模型能力将接近人类专家水平，应用场景将全面铺开，商业模式将趋于清晰。阶跃星辰的目标，是在那场较量中成为不可或缺的”中国力量”。

Aiii人工智能创研院(Aiii.org.cn)精选文章《专访阶跃星辰技术负责人：Step 3.5 Flash的研发逻辑与2026攻坚方向》文中所述为作者独立观点，不代表Aiii人工智能创研院立场。如有侵权请联系删除。如若转载请注明出处：https://www.aiii.org.cn/236.html

专访阶跃星辰技术负责人：Step 3.5 Flash的研发逻辑与2026攻坚方向

一、关于Step3.5Flash：我们为何选择”非对称作战”

Q：Step3.5Flash发布时，行业正陷入”参数军备竞赛”，GPT-4、Kimik1.5等模型都在追求万亿参数规模。你们为何反其道而行之，专注于中小参数的极致优化？

Q：具体采用了哪些技术手段实现这一目标？

二、技术路线之争：我们为什么不相信”唯ScalingLaw”

Q：你们的技术路线似乎与OpenAI、DeepSeek等坚持的”ScalingLaw至上”有所分歧。如何看待这种分歧？

Q：这种路线选择是否意味着中国大模型厂商在算力受限环境下的”被迫创新”？

三、关于开源与生态：我们为何选择”半开放”策略

Q：阶跃星辰在开源策略上相对谨慎，Step3.5Flash目前仅提供API而非模型权重。这与DeepSeek、阿里等厂商的激进开源形成对比，背后有何考量？

Q：如何看待DeepSeek等开源厂商带来的生态压力？

四、2026攻坚方向：从”语言智能”到”行动智能”

Q：展望2026年，阶跃星辰的技术攻坚重点是什么？

Q：这听起来像是通往AGI的路径。你们如何定义AGI，以及预计的时间表？

五、关于中国大模型产业：冷静与信心

Q：最后，如何看待中国大模型产业在全球竞争中的位置？

关于作者

主编

发表回复

专访阶跃星辰技术负责人：Step 3.5 Flash的研发逻辑与2026攻坚方向

一、关于Step3.5Flash：我们为何选择”非对称作战”

Q：Step3.5Flash发布时，行业正陷入”参数军备竞赛”，GPT-4、Kimik1.5等模型都在追求万亿参数规模。你们为何反其道而行之，专注于中小参数的极致优化？

Q：具体采用了哪些技术手段实现这一目标？

二、技术路线之争：我们为什么不相信”唯ScalingLaw”

Q：你们的技术路线似乎与OpenAI、DeepSeek等坚持的”ScalingLaw至上”有所分歧。如何看待这种分歧？

Q：这种路线选择是否意味着中国大模型厂商在算力受限环境下的”被迫创新”？

三、关于开源与生态：我们为何选择”半开放”策略

Q：阶跃星辰在开源策略上相对谨慎，Step3.5Flash目前仅提供API而非模型权重。这与DeepSeek、阿里等厂商的激进开源形成对比，背后有何考量？

Q：如何看待DeepSeek等开源厂商带来的生态压力？

四、2026攻坚方向：从”语言智能”到”行动智能”

Q：展望2026年，阶跃星辰的技术攻坚重点是什么？

Q：这听起来像是通往AGI的路径。你们如何定义AGI，以及预计的时间表？

五、关于中国大模型产业：冷静与信心

Q：最后，如何看待中国大模型产业在全球竞争中的位置？

关于作者

主编

相关推荐

发表回复