博亚boya(中国) 华为昇腾950白皮书公布:自研144GB高速内存、4倍性能普及

快科技6月11日讯息,前几天华为暴露昇腾芯片正在以一年一代、算力翻倍的速率演进,全新一代昇腾950DT芯片将于8月份正经上线华为云平台。
昇腾950系列是客岁9月份的全衔接大会上发布的新一代昇腾平台的首代产物,本色上有昇腾950PR和昇腾950DT两款产物构成,二者使用的处罚器中枢是相同的,但搭配的内存系统不同,针对的市集亦然不同的。
把柄华为的说法,昇腾950PR摄取的是昇腾950中枢+HiBL 1.0内存,主要面向推理Prefill阶段和推选业务场景,比拟高性能、高价钱的HBM3e/4e,唐突大大缩小推理Prefill阶段和推选业务的投资。
昇腾950DT更珍摄推理Decode阶段和观察场景,由于推理Decode阶段和检核对互联带宽和访存带宽条目高,华为开辟了HiZQ 2.0,使内存容量达到144GB,J9九游会app2026世界杯中国官方下载内存窥伺带宽达到4TB/s。同期把互联带宽普及到了2TB/s。
华为日前又把昇腾950的架构白皮书公布了,内部有更把稳的架构细节,有道理的是昇腾950PR、DT底下还各有一个低容量版块,从刻下128GB、144GB减少到了112GB、96GB,但带宽莫得缩小,应该是计划到不同场景下的上下配。
具体的架构不错望望这个白皮书的先容,博亚体育跟着昇腾950DT将来2个月的部署上线,144GB高速内存、4TB/s带宽及MXFP4带来的4倍性能普及有望鼓动国产大模子进一步普及。

昇腾950系列基于华为自研的第三代达芬奇(DaVinci)架构,构建了生动、各种且广泛的AI算力底座。
该架构全面营救 TF32、FP16、BF16、FP8、MXFP8、HiF8、INT8及MXFP4 等多种精度身手,唐突精确适配不同场景的模子需求。
通过营救SIMD/SIMT 搀杂编程形式,并配备大容量L2 Cache 与超高片上访存带宽,昇腾 950唐突最大化开释算力潜能,显赫普及运筹帷幄成果。
除不凡的AI算力外,昇腾950还集成了广泛的通用运筹帷幄与多媒体处罚本领:
通用CPU:集成华为自研的 Linx816 CPU 中枢,营救物理双线程工夫,提供强盛的通用逻辑处罚本领。
媒体处罚:内置DVPP(数字视觉预处罚)子系统,提供硬件级的图像预处罚、编解码加快本领。
安全引擎:搭载专用安全算法引擎,确保数据处罚的全链路安全。
昇腾950具备业界跳跃的 IO 蔓延本领,整芯片集成72 Lane HiLink SerDes,永别为18个X4端口。
每个端口营救最高达 4×112Gbps的HiLink互联速率,使整芯片对外IO带宽峰值达到 2TB/s。
在聚积契约栈方面,全面营救URMA、UB Memory、PCIe 5.0及UBoE 等多种先进聚积契约,为大范畴集群组网提供高隐约、低延伸的衔接保险。
新增精度身手:原生营救HiF8、MXFP8、FP8、MXFP4等前沿低精度身手,无缺契合大模子量化需求。
算力跃升:比拟上一代BF16精度,昇腾 950 MXFP4 张量浮点峰值算力普及高达4倍。




【本文闭幕】如需转载请务必注明出处:快科技
2026美加墨世界杯中国官方网页版拖累剪辑:宪瑞博亚boya(中国)
著述内容举报 ]article_adlist--> 声明:新浪网独家稿件,未经授权松懈转载。 -->
备案号: