-
HPC-Ops技术拆解:腾讯算力开源的核心架构与行业复用价值
腾讯混元AIInfra团队悄然将HPC-Ops开源至GitHub,这个面向LLM推理场景的高性能算子库,让混元大模型的推理QPM(每秒查询数)提升30%,DeepSeek模型提升1…
-
代码大模型技术迭代:Qwen3-Coder-Next 的核心突破与产业适配性
2026年2月初,阿里巴巴通义千问团队悄然开源了Qwen3-Coder-Next。没有盛大的发布会,没有夸张的参数宣言,但技术社区的反应却异常热烈,这个仅有30亿激活参数(总参数8…
-
智能体工程核心:Karpathy 定调的智能体研发框架与技术难点
2025年6月,旧金山首届YCAIStartupSchool的讲台上,AndrejKarpathy用一场39分钟的演讲,给狂热的智能体(Agent)赛道浇了一盆冷水,同时又点燃了一…
-
稀疏注意力机制创新:美团新技术如何提升大模型的效率与成本控制?
当算力成本成为大模型商业化的生死线,一家以”送外卖”闻名的公司,正在用工程思维重构AI基础设施的底层逻辑。 2025年初,美团大模型团队LongCat放出一…
-
MoE架构再升级:Step3-VL-10B的多模态推理技术底层解析
2026年1月20日,阶跃星辰开源的Step3-VL-10B在AI社区投下一枚”小核弹”:仅用10B参数,在AIME数学竞赛中拿下94.43分,超越GPT-…
-
从Sonnet5传闻到文心5.0落地:中美大模型迭代的速度与深度对比
2026年1月22日,百度文心5.0正式版上线,2.4万亿参数、原生全模态统一建模、激活参数比低于3%,这套组合拳打出来,业界才猛然意识到:中国大模型的迭代逻辑已经变了。 几乎同一…
-
算力开源破局:腾讯 HPC-Ops 如何重塑国内 AI 基础设施共享生态?
2025年初,当DeepSeek以开源姿态震动全球AI圈时,另一场同样关键的”开源”正在腾讯内部悄然酝酿。一个月后,腾讯混元AI Infra团队将名为HPC…