吾看书

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

一文读懂华为昇腾芯片:国产ai算力的中流砥柱(第2页)

据说910C之后,还有910D ,采用5nm制程,4Die封装,支持FP8 。今年5 - 6月份回片,预期2026Q2 - Q3大规模量产。不过这个消息来源不太可靠,只能仅供参考。再往后,华为可能就会推出昇腾920系列,采用下一代工艺,更先进制程,努力缩小和英伟达的差距。

除了昇腾310和910之外,华为其实还有昇腾610 。昇腾610也称为MDC610,是智能驾驶芯片,用于华为自己的智能驾驶平台(MDC) 。根据资料显示,昇腾610采用了7nm制程,AI算力达到200TOPS@INT8或100TFLOPS@FP16 ,目前已经实现量产。

三、昇腾芯片的架构奥秘

华为昇腾芯片采用了自家独特的达芬奇架构,这可是昇腾芯片的核心技术之一,就像是给芯片赋予了一颗超级“智慧大脑” 。

这个架构专为人工智能计算设计,具有超高的计算能效比。咱们以昇腾910为例,它强大的算力能够满足大规模深度学习计算的需求 。在处理矩阵运算等人工智能常见计算任务时,达芬奇架构就展现出了极高的效率。比如说,在训练一个超大规模的图像识别模型时,需要处理海量的图像数据和复杂的计算,昇腾910凭借着达芬奇架构,能够快速地完成这些矩阵运算,大大缩短了模型训练的时间。

昇腾芯片还具备先进的张量处理单元(TPU) ,这就像是一个专门为神经网络计算打造的“加速引擎” 。它能够加速神经网络中的张量计算,让模型训练和推理的速度大幅提升 。在图像识别任务中,昇腾芯片可以快速处理大量的图像数据,准确识别出目标物体,这主要就得益于其高效的架构设计和强大的计算核心,以及TPU的加速作用。

而且,昇腾芯片在内存子系统等方面也有创新。就拿昇腾950系列来说,它将内存访问颗粒度从512字节减少到128字节 ,实现更精细的内存访问控制,大幅提升了对离散、不连续内存访问场景的支持能力 。配合华为自研的两种HBM内存技术,形成了完整的场景化内存解决方案。

HiBL 1.0低成本HBM(昇腾950PR搭载) :在保证128GB容量和1.6TB/s带宽的基础上,通过材料与封装工艺创新,将推理Prefill阶段和推荐业务的硬件投资成本降低40%以上 ,解决了大规模部署的经济性瓶颈。这就好比以前买一台设备要花很多钱,现在通过技术创新,用更少的钱就能达到差不多的效果,让更多企业用得起。

HiZQ 2.0高性能HBM(昇腾950DT搭载) :实现144GB超大内存容量和4TB/s带宽,配合2TB/s的互联带宽,满足大模型训练和长文本推理对高访存带宽的严苛需求 ,为千亿参数模型训练提供了充足的内存支撑。比如在训练一个超大型的语言模型时,需要大量的内存来存储和处理数据,HiZQ 2.0高性能HBM就能很好地满足这种需求,保证模型训练的顺利进行。

在精度支持方面,昇腾950系列全面覆盖FP8/MXFP8/MXFP4等业界标准低数值精度格式 ,同时引入华为自研的HiF8精度模式 。在保持FP8计算效率的同时,精度接近FP16 ,有效解决了低精度计算中的精度损失问题 ,使推理结果准确性提升15% - 20% 。这种多精度支持能力使其能灵活适配从图像识别到自动驾驶等不同精度需求的AI场景。比如在自动驾驶场景中,对精度要求就非常高,HiF8精度模式就能在保证计算效率的同时,提高识别的准确性,保障行车安全。

四、基于昇腾芯片的硬件体系

基于昇腾芯片,华为开发了一系列丰富的硬件产品,就像是搭建了一个完整的AI算力“王国”,这些硬件覆盖了边缘推理、云端推理、云端训练三大场景 ,可以满足不同行业用户各种各样的AI计算需求。

本小章还未完,请点击下一页继续阅读后面精彩内容!

(一)Atlas 200I DK A2:开发者的得力“小助手”

Atlas 200I DK A2是面向开发者的高性能AI开发套件 ,它集成了昇腾310芯片,内置2个Al core ,可支持128位宽的LPDDR4X ,最大算力为22TOPS 。对于开发者来说,它就像是一个得力的小助手,方便开发者快速上手进行AI开发。比如说,一些想要开发智能安防应用的开发者,就可以利用Atlas 200I DK A2,快速搭建起一个简单的图像分析系统,进行算法测试和功能验证。

(二)Atlas 300T训练卡:云端训练的“加速引擎”

Atlas 300T训练卡基于昇腾910芯片 ,集成32个达芬奇AI核 + 16个TaiShan核 ,能够提供280TFLOPS FP16的算力 。在云端训练场景中,它就像是一个强大的“加速引擎” 。当企业需要训练大规模的深度学习模型时,Atlas 300T训练卡就能发挥它的强大算力,快速完成模型训练,大大提高了训练效率,节省了时间成本。

(三)CloudMatrix 384超节点:集群算力的“超级战舰”

前面提到的CloudMatrix 384超节点,由384颗昇腾910C芯片构建 ,系统性能比英伟达的GB200 NVL72更强 。它就像是一艘“超级战舰”,在集群算力方面展现出了强大的实力。通过将众多昇腾芯片组合在一起,形成了一个超级强大的计算集群,能够满足那些对算力要求极高的大型企业和科研机构的需求,比如进行超大规模的气象预测模型训练、基因数据分析等。

热门小说推荐
开局签到刑警队

开局签到刑警队

一个刑侦民警,猝亡穿越平行世界,获得“正义之眼”签到系统加持,横扫警界,惩恶扬善,破大要奇悬案无数。此世潜龙在渊善蓄势,豪情正气放狂歌,一飞冲天征八方,生死无话震乾坤!龙泉正义剑在手,警探升警星,一条硬汉路!......

步步生莲

步步生莲

步步生莲情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的历史军事小说,步步生莲-月关-小说旗免费提供步步生莲最新清爽干净的文字章节在线阅读和TXT下载。...

重云记

重云记

我也曾俯瞰巅峰·也曾傲视群雄!纵那世间百态,也不如你倾城一笑!如今这般!也不过,重头再来罢了!看重云之子如何从巅峰到人间低谷,爱恨情仇该如何抉择。是选择爱你!还是选择恨你!纵有不世修为可换否?再与你,再续前缘!......

重生哈利波特

重生哈利波特

②简介:主角智力全满,魅力全满,武力全满。~~~~~~...

千年劫之神女传说

千年劫之神女传说

一场跨越千年的虐恋,一世上古神女的尘梦。神女来到凡间,却发生了这么多奇怪的事情……真命天子?霸道妖王?还有魔尊大人?选谁!命格奇异,幸有他的千年守护;为爱成魔,唯负天命不负...

从洪荒到盗墓

从洪荒到盗墓

小麒麟墨玖是洪荒三族大战时出生的,出生时父母忙着要跟龙族凤族战斗,便把它安置在了一个洞穴里,结果谁知道三族打崩了洪荒大陆,牵扯到墨玖掉进了混沌中,被盗墓天道给捡了去,并送给了它的小崽子养……\n第一次下墓,张家族长看着小麒麟追着傀跑,傀惨叫连连,默默地收回了自己的手……\n再后来,跟着墨玖下墓的人发现,邪物喜欢追着自己跑,墨玖喜欢追着邪物跑……\n简介无能……\n本文ooc警告,作者业余的,没时间改文,可能有错别字,爽文,仙道与科技之道结合,与原著有差别!!!...