了解華為云最新動態(tài)
2025年9月29日,DeepSeek-V3.2-Exp模型正式發(fā)布并開源。模型引入稀疏 Attention 架構,這種架構能夠有效降低計算資源消耗并提升模型推理效率。華為云第一時間完成對 DeepSeek-V3.2-Exp 模型的適配工作,最大可支持160K長序列上下文長度。目前,該模型已正式上架華為云大模型即服務平臺 MaaS,為企業(yè)及開發(fā)者提供模型體驗和 API 服務。
202509291_1.jpg)
華為云ModelArts推理平臺基于CloudMatrix384基礎設施,為DeepSeek-V3.2-Exp模型提供穩(wěn)定、高可靠推理服務。ModelArts推理平臺能夠根據(jù)實際負載需求,按需供給和分配模型推理算力資源,實現(xiàn)資源分時復用與靈活擴縮容。針對DeepSeek-V3.2-Exp 模型,此次仍沿用大EP并行方案部署,基于稀疏Attention結構疊加實現(xiàn)長序列親和的上下文并行策略,并兼顧模型時延和吞吐性能。

即刻體驗DeepSeek-V3.2-Exp模型的卓越能力:
方式一:
訪問華為云官網(wǎng)導航菜單“大模型”——點擊“DeepSeek-V3.2-Exp首發(fā)上線-立即體驗”,進入大模型服務平臺模型體驗頁面,選擇“DeepSeek-V3.2-Exp”模型體驗。
方式二:
掃描下方二維碼,直接訪問大模型服務平臺模型體驗頁面,與DeepSeekV3.2-Exp進行實時互動。