在刚刚结束的华为中国合作伙伴大会2026上,华为重磅发布并展出了搭载全新昇腾950PR(Ascend 950PR)处理器的 AI训练 推理加速卡Atlas 350。

搭载全新昇腾950PR处理器的AI训练推理加速卡Atlas 350。记者时娜摄
昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方、百信7家华为核心伙伴在会上发布了基于Atlas 350的 服务器 整机产品,标志着昇腾950代际推理算力正式进入商用阶段。

上市公司 软通动力 旗下的软通华方在会上发布的“超强A860 A5”就是其中之一。软通动力计算产品事业群企业级产品研发管理本部总经理邓忠良将超强A860 A5比作赋能大模型时代的“核武级”算力。据介绍,超强A860 A5是一款6U2路AI服务器产品,搭载鲲鹏920新型号处理器,可支持8块昇腾Atlas350加速卡,具有超强算力、灵活拓展、安全可靠等特点,适合用于AI大语言模型训练和推理、AI加速计算、视频分析等应用场景。
科大讯飞 集团副总裁、星火企业军团总裁刘江在会上表示,讯飞新一代星火大模型也将与昇腾910/950系列算力底座进行充分适配,为用户提供“懂行业、能干活、守规矩、会进化”的整体AI解决方案。
算力的基础是 芯片 ,昇腾芯片是华为AI算力战略的基础。华为2018年发布的昇腾310芯片,是昇腾系列芯片首款产品。2019年,华为发布昇腾910芯片;2025年,昇腾910C芯片随着Atlas900超节点规模部署,昇腾芯片逐渐为外界所熟悉。
去年9月,华为副董事长、轮值董事长徐直军在华为全联接大会2025上首次介绍了昇腾950系列芯片,并官宣了昇腾950系列芯片的发布时间——昇腾950PR将在2026年第一季度推出,首先支持的产品形态是标卡和超节点服务器。
在本次华为中国合作伙伴大会上,昇腾950PR随标卡Atlas 350如约亮相,受到业界的广泛关注。

Atlas 350展台成为中国合作伙伴大会2026网红打卡点。记者时娜摄
与前一代昇腾芯片相比,昇腾950PR在低精度数据格式、向量算力、互联带宽及自研HBM等方面实现大幅提升。
据 华为昇腾 计算业务总裁张迪煊介绍,Atlas 350的单卡算力达到了 英伟达 H20的2.87倍,是目前国内唯一支持FP4低精度的推理产品;HBM(高带宽内存)容量是H20的1.16倍,达到了112GB,多模态生成速度可以提升60%;内存访问颗粒度从512字节减少到128字节,小算子访存效率提升4倍。
在大会展厅Atlas 350展台,上证报记者看到了Atlas 350的具体参数:Atlas 350的FP4精度算力为1.56P,带宽达到了1.4TB/s;功耗为600W,是H20的1.5倍。

大会展出Atlas 350具体参数。记者时娜摄
展台工作人员告诉记者,Atlas 350除了支持FP16、FP8外,还支持更低精度的FP4。这意味着,集成Atlas 350板块的服务器能够支持更大的模型以及时延更低的推理,精度小了,计算速度就会更快,寄存器效率也会更高。目前Atlas 350在 互联网 推荐场景的实测数据显示,该卡的时延更低、响应更快,特别适合 短视频 、电商、广告推荐等高并发场景。在大模型推理、文生图、文生视频等多模态场景,其性能也和英伟达的L20相当。
张迪煊表示,基于Atlas 350等产品,结合AI发展趋势与客户需求,昇腾将打造大、中、小三大核心算力场景,助力伙伴满足差异化场景需求,共同深耕行业智能化。
面向万亿级模型,昇腾384超节点凭借“超大带宽、超低时延、统一内存编址”三大特性,实现有效算力线性扩展,更好支撑大模型训练与推理,已在多行业成功落地;面向千亿级模型,昇腾提供“开箱即用”的单机服务器,满足“快速部署”与“成本可控”的平衡;面向百亿级模型,昇腾开放更多算力档位、更高集成度、更宽温度设计的模组/板卡,结合更多OS兼容、更多场景SDK( 软件 开发工具包),使能伙伴打造多样化产品。
会上,昇腾联合20家行业头部伙伴,发布了2026昇腾AI应用场景解决方案,覆盖辅助办公、AI实训、电子病历、智能客服、政务办公等多个行业核心场景,以“轻量部署、快速落地、可规模复制”的特点,破解行业智能化部署复杂、周期长的痛点。
此外,“养虾”热潮再度激起了一体机的需求,华为副总裁、ICT产品组合管理与解决方案部总裁马海旭在会上透露,过去一个多月已有十几家合作伙伴推出了基于昇腾的OpenClaw一体机。截至目前,昇腾已联合伙伴打造400多款行业一体机,服务客户逾2700家,占据国内一体机市场80%以上份额。
