ai 人妖 智算“万卡”潮起,国产AI芯片迎高光时刻

发布日期:2025-01-10 10:25    点击次数:78

ai 人妖 智算“万卡”潮起,国产AI芯片迎高光时刻

文 | 半导体产业纵横ai 人妖

GPU 万卡集群,小米下场了!摩尔线程智算集群扩张至万卡!中国转移将商用三个自主可控万卡集群 ...... 一系列标题的袭来,让笔者一会儿表示到,仿佛在不经意间,智能算力树立已然迈入万卡期间。

那么到底什么是万卡集群?万卡集群到底有哪些作用?有必要部署万卡集群吗?

01 什么是万卡集群?

万卡集群,是指由绝顶一万张加快卡(如 GPU、TPU 或其他专用 AI 加快芯片)构成的高性能计较系统,用以加快东谈主工智能模子的窥探和推理经过。

至于为什么需要一万张加快卡?

无人不晓,大模子竞赛的本体是算力竞赛。比如这里有一个超大土堆,放一个工东谈主和放一万个工东谈主,在成果上笃定会有质的飞跃。

以 OpenAI 窥探 GPT 模子为例,GPT-4 需要使用 2.5 万张英伟达 A100 GPU,并行窥探 100 天傍边的时分,在此期间要处理 13 万亿个 token,何况触及大致 1.76 万亿个参数。在不久的改日,开发大模子所需的算力将收场指数级的增长,关于行将亮相的 GPT-5,瞻望该模子的窥探需要部署 20 万 ~30 万个 H100 GPU,耗时 130~200 天。

如今 OpenAI 发布 ChatGPT 已有两年的时分,从树立程度上看,国外头部厂商在 2022 年、2023 年仍是完成万卡集群搭建。比如 2023 年 5 月,谷歌推出的 AI 超等计较机 A3,搭载了约 26000 块英伟达 H100 GPU;2022 年,META 文告了一个由 1.6 万块英伟达 A100 GPU 构成的集群。到了 2024 岁首,META 进一步扩大范围,建成了两个各含 24576 块 GPU 的集群,并设定了宏伟主义:到 2024 年底,构建一个包含 35 万块英伟达 H100 GPU 的强大基础本领。亚马逊 Amazon EC2 Ultra 集群遴荐了 2 万个 H100 TensorCore GPU。

再看中国的智能算力树立情况。

02 国产万卡集群,谁在布局?

日前,中国工程院院士郑纬民指出,"构开国产 AI 卡的万卡大模子窥探平台很难,但也很迫切以及必要。"

当下,国内已有多家厂商及机构入辖下手向万卡集群界限拓展业务。

字据《智算产业发展征询敷陈 ( 2024 ) 》炫夸,在中国,超万卡集群的智算中心已达十余个。

本年以来, 中国转移 、联通、电信三大运营商均在加快鼓舞超万卡集群智算中心的树立。

本年 8 月,中国电信在智算汇集树立方面得回了权臣进展,其上海与北京两大万卡集群已得手投产运营。

中国转移位于呼和浩特、哈尔滨、贵阳的万卡级别的智算中心仍是先后投产运行。据悉,三大集群总范围近 6 万张 GPU 卡,充分知足大模子鸠合窥探需求。

中国联通正在打造上海、呼和万卡智算集群,全网智算算力超 15EFLOPS,发布 AICC、AICP、星罗疗养平台等五大智算居品,提供涵盖国度"东数西算"要害、31 省重心城市、超 600 旯旮节点的 AIDC 基座。

小米也正策画树立一座 GPU 万卡集群。据悉,小米在其大模子团队成立地仍是领有 6500 张 GPU 资源。

字节在 2023 年就已成就起绝顶 1 万张卡的 Ampere 架构 GPU (A100/A800) 集群,而后还在树立大范围 Hopper 架构(H100/H800)集群。

如今,"万卡集群"被业界视作是这一轮大模子竞赛的"入场券",以致还有不少厂商仍是运行布局"十万卡集群"。

百度的百舸 4.0 通过一系列居品手艺蜕变,仍是大略收场十万卡集群的高效照顾。

阿里巴巴的阿里云可收场芯片、作事器、数据中心之间的高效协同,扶植 10 万卡量级的集群可扩张范围,已作事世界一半的东谈主工智能大模子企业。

腾讯已文告自研星脉高性能计较汇集全面升级,星脉汇集 2.0 搭载全自研的汇集斥地与 AI 算力网卡,大略扶植超 10 万卡大范围组网,汇集通讯成果比上一代进步 60%,让大模子窥探成果进步 20%。

03 国产 AI 芯片公司,得到利好

人妖sm

彰着,在运营商以及科技巨头纷纷入场布局之际,国产 AI 芯片公司也迎来利好。

华为昇腾

据悉,以政府为主导的城市智能计较中心多遴荐国产 A1 芯片中的杰出人物如华为昇腾等,其中华为更是在统计的 20 多个城市为主体的智能计较中心中占据 79% 的市集份额,处于国产 AI 芯片的源流位置。在可意象的 2025 年,昇腾芯片及作事器的市集依旧会处于病笃的供给方位。

寒武纪

2023 年寒武纪想元(MLU)系列云表智能加快卡在中国转移崇拜上线。戒指 2023 年 12 月,中国转移已有 12 个省公司、绝顶 70 个 AI 业务完成向寒武纪想元系列云表智能加快卡的转移。

2024 年 8 月,中国转移云智商中心参建的全球运营商最大单集群智算中心——中国转移智算中心(哈尔滨)崇拜投产使用。该智算中心部署超 1.8 万张 AI 加快卡,AI 芯片国产化率达 100%,可提供 6.9EFLOPS(每秒 690 亿亿次浮点运算)智能算力。据悉,该智算中心等于由寒武纪参与树立。

南京智能计较中心由南京市麒麟科技蜕变园与波澜、寒武纪共同打造,遴荐波澜 AI 作事器算力机组,搭载源流的寒武纪想元 270 和想元 290 智能芯片及加快卡,已运营系统的 AI 计较智商达每秒 80 亿亿次 ( 800P OpS ) 。

大模子爆火确当下,AI 的窥探和推理芯片及训推一体化等芯片成为市集"香饽饽",寒武纪在此界限的深耕研发,加快想元系列芯片的迭代。

摩尔线程

2023 年 12 月摩尔线程 KUAE 智算中心揭幕,这是国内首个以国产全功能 GPU 为底座的大范围算力集群,以全功能 GPU 为底座,提供软硬一体化的全栈照顾有计算。

2024 年 7 月,摩尔线程伙同中国转移通讯集团青海有限公司、中国联通青海公司、北京德谈信科集团、中国动力树立股份有限公司总承包公司、桂林华崛大数据科技有限公司等,区别就三个万卡集群技俩进行了计谋签约,多方将聚力共同构建好用的国产 GPU 集群。

燧原科技

2021 年燧原科技与之江实验室在之江实验室南湖新园区签约成立"燧原 - 之江东谈主工智能芯片伙同征询中心"。

成渝智算中心由四川并济科技投建,燧原科技提供搭建算力底座。

与此同期,燧原科技还助力太湖亿芯(无锡)智算中心、甘肃庆阳算力要害的树立。

天数智芯

中国转移智算中心(呼和浩特)是全球运营商界限内范围最大的单体液冷智算中心,智算范围高达 6.7EFLOPS(FP16),领有国度级 N 节点万卡范围 AI 窥探场。

天数智芯在该技俩中充分进展天垓 150 居品的格外性能与普通适用性,与新华三信息手艺强强伙同,共同打造高性能 AI 窥探作事器。

壁仞科技

壁仞科技也参与中国转移呼和浩特智算中心技俩。

此外,壁仞科技的壁砺系列通用 GPU 算力居品还在中国电信落地千卡集群并开展生意化应用,另外皮中国电信集团新一轮国产化 GPU 集采技俩中,壁仞科技的主流 GPU 居品仍是纳入中国电信的集采名录,成为中国电信的主要 GPU 供应商。

沐曦科技

2024 年 11 月,由上海联通联袂加佳科技、沐曦共同打造的曦源一号 SADA 万卡集群算力技俩第一期千卡国产算力集群在上海联通临港机房崇拜落地。该技俩以沐曦 GPU 芯片手艺居品为中枢,效力构建集算力、算法、数据、产业应用为一体的东谈主工智能产业重生态。

据悉,沐曦和加佳科技已在上海、湖南、江苏等多地建成智算中心,并策画于 2025 年 6 月完成 10000 卡国产高质料算力树立。

04 何啻"万卡",以致要"百万卡"

从早期智算中心苦恼起步,一步步发展到如今 "万卡" 范围的算力集群纷纷落地,这无疑是巨大的飞跃。当下,行业头部厂商更是将视线进一步拓宽,已然聚焦于更为深广的 "百万卡" 主义。

近日,在 AI 市集快速增长的布景下,博通市值龙套 1 万亿好意思元,创下历史新高。

博通首席扩充官陈福阳示意,他有信心在 2020 年代后期络续加大对东谈主工智能的投资。他指出,三年内,博通的客户策画构建配备数百万个 AI 芯片的大范围计较集群,从而推动市集大幅增长。

博通正与三大客户互助开发 AI 芯片,策画到 2027 年在汇集集群中部署 100 万个芯片。据 CNBC 报谈,他预见,到 2027 年,其 XPU 和 AI 汇集组件的总市集范围将达到 600 亿至 900 亿好意思元。

固然博通尚未崇拜公布其芯片客户,但分析师示意,该公司正在与谷歌、Meta 和字节高出互助,以加快 AI 系统的窥探和部署。据《金融时报》报谈,该公司已为此开发了定制处理器。

05 "万卡集群"果真有必要吗?

先说论断,"万卡集群"的树立一定是有必要的。

刻下,我国智能算力供不应求的问题较为隆起,大模子对算力的需求增速远超单颗 AI 芯片性能的进步范例。斟酌敷陈炫夸,2023 年,中国智能算力需求达 123.6EFLOPS,而供给仅为 57.9EFLOPS,供需缺口一目了然。利用集群互联弥补单卡性能短板,或是现阶段缓解 AI 算力荒最值得探索与践诺的有用路线。

不外,在鼓舞 "万卡集群" 树立进程中,有两大要害勤勉亟待照顾:其一,若何高质料完成树立任务,保证集群在踏实性、高效性、兼容性等多方面达到范例条件;其二,建成后若何充分挖掘其应用价值,使其在东谈主工智能窥探、大数据分析等适配场景进展最大作用,根绝资源空置与蚀本欣然。

源流,不妨将 "万卡集群" 类比为参与 "多东谈主多足" 游戏的团队,全球都明晰,让一群东谈主如消失个东谈主般整皆齐截地前行并非易事,要疗养上万张计较卡协同高效功课、达成性能的线性扩张、确保任务无绝行运行,这对集群的想象、疗养以及容错智商都提议了极高挑战。

其次,智算中心的树立仅仅一个开端,更迫切的是后续的有用诓骗。

据报谈,由于智算中心的投资、树立、运营每每由不同主体负责,前期树立方往往对后续运营阵势、作事范例枯竭饱胀考量,出现 "只管树立、不顾运营"、树立与运营脱节的情况,影响了客户体验,致使不少城市所建智算中心的机架利用率不尽东谈认识。

从生意阵势来讲,智算中心大多以出租或售卖算力为主要盈利技能,但是因行业尚未调理算力订价范例,不同智算中心价钱各异悬殊,市集领受程度受限。

近期,多位智算中心界限从业者看望国内各地智算中心后,他们中的一些东谈主向《智能涌现》反应,刻下国内算力中心市集较为低迷。一位业内东谈主士泄漏:"就现在所掌抓情况,多数机房出租率大致在 20% - 30% 区间浮动,部分企业级智算中心出租率以致低至 10% 傍边。"

要明晰,智算中心不仅前期需要参加大量资金购置 GPU 等 AI 芯片,后续运营阶段雷同需要无间注资。

《智能涌现》不久前发文指出,一台英伟达 H100 作事器(8 卡)租出价钱,已从岁首的 12- 18 万元 / 月,下滑至现在的 7.5 万元 / 月,降幅约 50%。

若按照刻下机房 20% 的利用率来算,一个英伟达 H100 千卡集群智算中心每年营收仅 2300 万元(即 7.5 万元 / 月 ×12 个月 ×128 台作事器 ×20%),这意味着,即便算力中心拼凑督察运营,所得收入基本只可笼罩一半的正常运营成本,前期参加的成本根柢无从回本。

说七说八ai 人妖,"万卡集群"已成为智能算力期间的迫切里程碑,绮丽着我国在东谈主工智能界限的算力树立迈上了新的台阶。从小米、中国转移等科技巨头正积极布局万卡集群,以期在这场大模子竞赛中占据成心地位。但是,万卡集群的树立并非易事,智算中心需要多万古分能力通过运营收入收回投资,行业也还需更多的探索。