当全球人工智能竞争进入算力决胜局,芯片作为核心底层设施的战略价值愈发凸显。2025年12月17日,沐曦集成电路正式登陆科创板,上市首日股价盘中最高涨幅突破755%,从发行价104.66元飙升至895元的高位。这一震撼市场的表现,不仅折射出资本市场对国产芯片替代的强烈信心,更标志着中国GpU产业从技术追赶迈入与国际巨头并行发展的关键转折。而在这场国产算力崛起的浪潮中,商汤科技与沐曦的深度战略合作,以“高性能算力底座+高适配技术协同”的创新模式,构建起覆盖技术研发、产品落地、生态共建的完整闭环,为国产AI算力产业树立了标杆。
一、时代必然:国产算力突围的“双向奔赴”
全球AI技术竞争的白热化,让算力成为国家核心竞争力的重要组成部分。长期以来,高端GpU市场被国际巨头垄断,国内AI产业面临“算力卡脖子”的风险——不仅采购成本高昂,还存在供应链不稳定、技术适配受限等诸多隐患。在此背景下,国产GpU的自主创新与生态构建,成为突破技术壁垒、保障产业安全的必然选择。
商汤科技与沐曦的合作,正是这场突围战中的关键布局,源于双方优势互补的战略契合。作为AI领域的领军企业,商汤已构建起“大装置+大模型+应用”的三位一体战略格局,其自主研发的AI基础设施“大装置”,需要海量高性能算力支撑从模型训练到行业落地的全链路需求。财报数据显示,商汤2024年生成式AI业务收入达24亿元,连续两年实现翻倍增长,这种爆发式增长背后,是对稳定、高效、自主可控算力的刚性需求。
而沐曦作为国内少数系统掌握高性能GpU全栈研发技术的企业,其核心产品曦云c系列GpU凭借全自主研发的架构与指令集,打破了国际技术垄断。曦云c500、c550及在研的c600系列,具备高性能、高自主可控、高扩展性三大核心优势,支持千亿参数以上大模型训练,且通过自研mxmAcA软件栈实现了对cUdA生态的高度兼容,完美契合商汤大装置的算力适配需求。一方是拥有场景、算法与海量数据的AI巨头,一方是手握自主核心技术的算力新锐,这场“算力供给”与“场景需求”的双向奔赴,为国产AI算力生态的构建奠定了坚实基础。
二、技术共研:“高性能+高适配”的协同突破
商汤与沐曦的合作,突破了传统产业链上下游“采购-供应”的简单协作模式,深入到底层技术共研的核心层面,形成“算法牵引硬件优化,硬件支撑算法迭代”的良性循环,最终实现“1+1>2”的性能突破。
1. 硬件性能:对标国际的国产算力底座
沐曦曦云c系列GpU的硬核性能,为双方合作提供了坚实基础。以曦云c500为例,其Fp32算力达到19.5 tFLopS,与英伟达A100 80Gb持平,在ResNet-50训练任务中比A100快7%,功耗却低11%,展现出卓越的性能功耗比。该系列采用自研xcoRE架构及指令集,配备标量、矢量和张量计算单元,支持多种混合精度计算,搭载64Gb hbm2e显存与7个高速metaxLink互连接口,可实现2卡至64卡的灵活互连拓扑,具备国内稀缺的高带宽、超多卡互连能力。
在研的曦云c600更是立足国产供应链,升级为xcoRE 1.5架构,新增Fp8 tensor及tensor转置指令,搭载hbm3e显存,显存容量提升至144Gb,进一步优化了大模型训练的性能与适配性。这些硬件优势,让曦云系列GpU成功嵌入商汤国产化算力布局,成为支撑“日日新”大模型、世界模型等前沿AI产品训练的核心硬件组件。
2. 软硬适配:定制化优化释放极致效能
如果说高性能硬件是“算力肌肉”,那么深度适配的软硬协同就是“神经网络”。商汤与沐曦建立了专属的深度适配机制:商汤开放AI算法框架与真实场景需求,将大模型训练中的算力瓶颈、数据处理特性等关键信息反馈给沐曦;沐曦则针对性优化GpU架构设计与软件栈,通过底层技术调整让硬件性能精准匹配算法需求。
这种协同模式已结出丰硕成果:双方联合完成了“日日新”多模态大模型的全流程适配调优,实现了国产GpU与商汤算力平台的全面兼容认证。更值得关注的是,双方合作攻克了GpGpU硬件架构适配难度远高于NpU的行业难题,实现了pd(prefill-decoding)分离技术在国产GpU上的首次大规模商用落地,将推理性价比提升了150%。据测算,采用沐曦GpU集群后,商汤大装置的算力成本下降约30%,而模型训练效率提升超过40%,完美诠释了“高适配”带来的价值增量。
三、场景共建:从技术验证到产业落地的闭环
技术的价值最终要通过场景落地来体现。商汤与沐曦以“算力集群+场景拓展”的融合模式,将协同创新成果快速转化为行业解决方案,覆盖智慧城市、智能制造、医疗健康等六大重点领域,实现了从技术验证到规模化商用的完整闭环。
1. 重点行业的标杆应用
在智慧城市领域,商汤的城市治理大模型需要处理海量视频监控、传感器数据,对实时推理算力要求极高。沐曦GpU的高并行计算能力与低延迟特性,让模型能够快速识别交通拥堵、异常事件等场景,为城市管理提供实时决策支持;在智能制造场景中,双方联合开发的AI质检解决方案,通过大模型对生产线上的产品缺陷进行精准识别,沐曦GpU的高效算力支撑让检测效率提升3倍以上,误检率下降50%;在医疗健康领域,商汤的医学影像分析模型借助沐曦GpU的高算力支持,能够快速处理ct、mRI等大型医疗影像数据,辅助医生进行疾病诊断,缩短诊断周期。
这些场景化应用不仅验证了国产算力的可靠性,更让技术在真实需求中持续迭代。例如,商汤内部测试时,用自研的NEo多模态模型处理智慧城市交通场景数据,在沐曦GpU的支撑下,仅用1亿样本就实现了95%的识别准确率,而传统模型需要10亿样本才能达标 。
2. 多元化的产品解决方案
为满足不同行业客户的差异化需求,双方联合打造了一体机解决方案、平台适配工具等丰富的产品矩阵。这些解决方案整合了沐曦的GpU硬件、商汤的大模型算法与行业Know-how,实现了“开箱即用”的便捷体验。
针对中小企业的算力需求,双方推出的轻量化AI算力一体机,集成了曦云c系列GpU与商汤简化版大模型,无需复杂部署即可支持小规模模型训练与推理;针对大型企业与智算中心,提供大规模GpU集群解决方案,通过metaxLink高速互连技术实现算力线性扩展,支持千亿参数级大模型的全参数训练——沐曦与中国科学院合作的国产千卡集群已完成多个大模型全参数训练,证实国产算力已具备大模型预训练能力。
四、生态共享:“算力mall”构建开放共赢格局
国产AI算力的崛起,离不开开放协同的产业生态。商汤与沐曦以“商汤大装置算力mall”为核心载体,构建起“算力+语料+算法+场景”的端到端闭环生态,打破了传统算力供给的封闭模式。
这一“面向未来的算力超级市场”,整合了商汤的AIdc资源、算法框架、行业模型与沐曦的GpU技术,形成了“需求对接-供给优化-技术迭代”的闭环机制。开发者和企业客户可以像选购商品一样,自由组合和调配多样化的算力资源、平台工具和行业模型服务,精准破解大模型落地难题。目前,该平台已吸引华为、寒武纪、壁仞科技等十余家国产生态伙伴加入,实现了国产AI芯片与商汤大装置的全面适配,让国产AI芯片在商汤千亿参数级的大模型训练与推理任务中,接受工业级标准的严苛考验。
这种开放生态模式带来了多重价值:对商汤而言,丰富了算力供给来源,让算力架构更具弹性,有效规避了高端芯片供应风险,为“日日新”大模型在金融、教育、交通等20余个行业的商业化应用提供了稳定支撑;对沐曦来说,通过与商汤等头部AI企业的合作,其曦云系列GpU在主流应用场景的渗透率持续提升,品牌影响力显着增强,已量产的曦思N100推理GpU出货量超颗,客户覆盖bAt、字节跳动等头部企业与多家国有云服务商;对整个行业而言,生态共享降低了AI技术落地的门槛,通过规模化应用摊薄了研发成本,加速了国产算力产业链的成熟。
五、格局重塑:国产算力从“可用”到“好用”的跨越
商汤与沐曦的深度协同,不仅实现了双方业务的共赢发展,更重塑了中国AI算力产业的竞争格局,推动国产算力从“可用”向“好用”的关键跨越。
在技术层面,双方的合作突破了国产GpU“性能不达标、适配不充分”的传统痛点,证明了国产算力完全能够支撑千亿参数级大模型的训练与推理,打破了国际巨头在高端算力领域的垄断神话。沐曦GpU在商汤场景中的成功应用,为国产芯片树立了“性能对标国际、适配贴合需求”的标杆,也为其他国产芯片企业提供了可借鉴的技术适配路径。
在产业层面,这种“AI巨头+芯片新锐”的协同模式,构建了自主可控的“芯片-框架-模型-应用”产业链条,降低了国内AI产业对国外算力的依赖。随着合作成果在更多行业的复制推广,国产AI产业将逐步形成技术自主、供应链稳定、生态完善的产业体系,为新质生产力的发展提供强大支撑。
在全球层面,商汤与沐曦的合作向世界展示了中国AI算力的创新实力。当曦云系列GpU在性能上对标国际主流产品,当商汤大模型在国产算力支撑下实现商业化落地,中国AI产业正从“追随者”转变为“引领者”,为全球人工智能竞争注入新的中国力量。
结语:算力同行,共筑AI生态新未来
沐曦的科创板上市与商汤的深度战略合作,是中国AI算力产业发展的重要里程碑。双方以“高性能”为基石、“高适配”为纽带、“生态化”为目标,构建起技术共研、场景共建、生态共享的三维驱动模式,不仅实现了自身的协同增长,更为主流国产AI算力产业链的发展提供了宝贵经验。
随着曦云c600等新一代产品的推进,以及“商汤大装置算力mall”生态的持续扩容,国产AI算力将在更多核心场景实现突破。未来,商汤与沐曦有望携手更多行业伙伴,持续深化软硬件协同创新,拓展生态边界,让自主可控的算力赋能千行百业,推动中国AI产业在全球竞争中占据更有利地位,共筑国产AI生态的新未来。
请大家记得我们的网站:爱读书屋(m.aidushuwu.com)大白话聊透人工智能更新速度全网最快。