了解CloudMatrix384超節(jié)點(diǎn)
了解CloudMatrix384超節(jié)點(diǎn)
了解CloudMatrix384產(chǎn)品詳情 ,請(qǐng)聯(lián)系對(duì)應(yīng)客戶經(jīng)理或華為云售前咨詢熱線
了解CloudMatrix384產(chǎn)品詳情 ,請(qǐng)聯(lián)系對(duì)應(yīng)客戶經(jīng)理或華為云售前咨詢熱線
新一代昇騰AI算力CloudMatrix384,支持最大規(guī)模384卡高速總線互聯(lián),訓(xùn)練推理性能大幅度提升
縱向擴(kuò)展(Scale up):通過(guò)高速網(wǎng)絡(luò)交換機(jī)組成384卡超節(jié)點(diǎn)
橫向擴(kuò)展(Scale out):參數(shù)面交換機(jī)最大支持16萬(wàn)卡集群規(guī)模
支持最大支持16萬(wàn)卡集群,用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升15倍,通信時(shí)延降低10倍
支持EMS服務(wù),跨節(jié)點(diǎn)共享KV緩存,大幅降低首Token時(shí)延。支持SFS Turbo服務(wù),實(shí)現(xiàn)AI數(shù)據(jù)加載速度提升10倍
超節(jié)點(diǎn)+大規(guī)模專家并行的技術(shù),支持單卡性能提升近4倍,支持一卡一專家分布式推理部署,相較于非超節(jié)點(diǎn)推理性能提升4X
支持朝推夜訓(xùn),通過(guò)訓(xùn)推共池,訓(xùn)練資源池和推理資源池資源靈活調(diào)度,實(shí)現(xiàn)資源利用提升30%以上
-
全新超節(jié)點(diǎn)架構(gòu)算力底座
支持最大超過(guò)10萬(wàn)卡集群,用高速總線互聯(lián)替代傳統(tǒng)以太,通信帶寬提升15倍,通信時(shí)延降低10倍
-
AI數(shù)據(jù)加速更快
支持EMS服務(wù),跨節(jié)點(diǎn)共享KV緩存,大幅降低首Token時(shí)延。支持SFS Turbo服務(wù),實(shí)現(xiàn)AI數(shù)據(jù)加載速度提升10倍
-
大規(guī)模集群性能更高
超節(jié)點(diǎn)+大規(guī)模專家并行的技術(shù),支持單卡性能提升5到10倍,支持一卡一專家分布式推理部署,相較于非超節(jié)點(diǎn)推理性能提升3X
-
資源利用率提升
支持朝推夜訓(xùn),通過(guò)訓(xùn)推共池,訓(xùn)練資源池和推理資源池資源靈活調(diào)度,實(shí)現(xiàn)資源利用提升30%以上
為什么選擇昇騰云
領(lǐng)先的昇騰架構(gòu)
昇騰達(dá)芬奇架構(gòu)領(lǐng)先,算力相比友商提升30%+;
MindSpore原生支持大模型開(kāi)發(fā),千億參數(shù)模型調(diào)優(yōu)時(shí)間縮短60%。

高效的遷移工具鏈
全流程昇騰遷移工具鏈,典型場(chǎng)景遷移至生產(chǎn)環(huán)境<2周;
易用的訓(xùn)練、推理遷移工具,支撐客戶自主昇騰遷移。

極致的資源利用
統(tǒng)一資源調(diào)度,資源極致利用,綜合分配率達(dá)90%;
彈性調(diào)度、訓(xùn)練&推理融合調(diào)度,資源發(fā)放<30分鐘。

豐富的生態(tài)
AI Gallery生態(tài)繁榮,沉淀行業(yè)資產(chǎn)10萬(wàn)+;
匯聚主流開(kāi)源大模型,高效連接云上昇騰算力。
