ai大模型本地部署
圍繞工業(yè)、城市、政務(wù)等重點(diǎn)場(chǎng)景打造以盤古CV大模型為中心的通用視覺能力,助力企業(yè)實(shí)現(xiàn)CV模型“工業(yè)化”生產(chǎn),并打通模型監(jiān)控-數(shù)據(jù)回傳-持續(xù)學(xué)習(xí)-自動(dòng)評(píng)估-持續(xù)更新的AI全鏈路閉環(huán)。在工業(yè)場(chǎng)景已有多個(gè)應(yīng)用。
盤古大模型 PanguLargeModels 盤古大模型 PanguLargeModels 盤古大模型是面向B端行業(yè)的大模型,包含L0中5類基礎(chǔ)大模型、L1行業(yè)大模型及L2場(chǎng)景模型三層架構(gòu) 盤古大模型是面向B端行業(yè)的大模型,包含L0中5類基礎(chǔ)大模型、L1行業(yè)大模型及L2場(chǎng)景模型三層架構(gòu)
體驗(yàn) 政企知識(shí)檢索 智能創(chuàng)意營(yíng)銷 行業(yè)API助手 行業(yè)研發(fā)助手 政企會(huì)議助手 文檔與學(xué)習(xí)成長(zhǎng) 盤古大模型 盤古大模型 什么是盤古大模型 盤古NLP大模型能力與規(guī)格 盤古大模型快速入門 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū)
全鏈路專業(yè)服務(wù),讓大模型從可用到好用 · 6大階段30+專業(yè)服務(wù),覆蓋大模型建設(shè)全流程,加速政企落地大模型 · 創(chuàng)新運(yùn)營(yíng)服務(wù)模式,實(shí)現(xiàn)全場(chǎng)景模型經(jīng)驗(yàn)沉淀、全流程運(yùn)營(yíng)賦能產(chǎn)業(yè),快速孵化大模型場(chǎng)景化應(yīng)用 大模型混合云十大創(chuàng)新技術(shù) 大模型混合云十大創(chuàng)新技術(shù) 了解詳情 十大創(chuàng)新技術(shù) 加速構(gòu)建企業(yè)專屬大模型
文檔與學(xué)習(xí)成長(zhǎng) 盤古大模型 盤古大模型 什么是盤古大模型 盤古預(yù)測(cè)大模型能力與規(guī)格 盤古大模型快速入門 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū) 優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場(chǎng)景化AI案例,助力AI賦能千行百業(yè)
提供高精度的全球模型,無(wú)需定制和訓(xùn)練,直接訂閱即可推理 多種部署形態(tài) 支持公有云、混合云、邊緣多種形態(tài),滿足不同需求 文檔與學(xué)習(xí)成長(zhǎng) 盤古大模型 盤古大模型 什么是盤古大模型 盤古科學(xué)計(jì)算大模型能力與規(guī)格 盤古大模型用戶指南 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū)
廣汽借助華為云盤古多模態(tài)大模型,打造業(yè)界首個(gè)支持點(diǎn)云生成的大模型,為其端到端仿真高效迭代提供強(qiáng)有力支撐。 文檔與學(xué)習(xí)成長(zhǎng) 盤古大模型 盤古大模型 什么是盤古大模型 盤古多模態(tài)大模型能力與規(guī)格 用戶指南 如何調(diào)用盤古大模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū)
端到端生產(chǎn)工具鏈,一致性開發(fā)體驗(yàn) 線上線下協(xié)同開發(fā),開發(fā)訓(xùn)練一體化架構(gòu),支持大模型分布式部署及推理 AI工程化能力,支持AI全流程生命周期管理 AI工程化能力,支持AI全流程生命周期管理 支持MLOps能力,提供數(shù)據(jù)診斷、模型監(jiān)測(cè)等分析能力,訓(xùn)練智能日志分析與診斷 容錯(cuò)能力強(qiáng),故障恢復(fù)快 容錯(cuò)能力強(qiáng),故障恢復(fù)快
大模型安全護(hù)欄 ModelArts Guard 大模型安全護(hù)欄 ModelArts Guard 大模型安全護(hù)欄(ModelArts Guard),做配套大模型的內(nèi)容安全防線 大模型安全護(hù)欄(ModelArts Guard),做配套大模型的安全防線,開放兼容,適用盤古大模型和三方大模型
大模型混合云TOP N 場(chǎng)景 大模型混合云TOP N 場(chǎng)景 1對(duì)1咨詢 了解華為云Stack 大模型行業(yè)場(chǎng)景落地三要素 大模型行業(yè)場(chǎng)景落地三要素 場(chǎng)景是大模型行業(yè)落地的關(guān)鍵所在,而在場(chǎng)景落地過(guò)程中,數(shù)據(jù)、經(jīng)驗(yàn)和生態(tài)是核心要素,數(shù)據(jù)的數(shù)量和質(zhì)量決定模型效果上限;經(jīng)驗(yàn)就像“名師指導(dǎo)”
《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》明確,具有輿論屬性或者社會(huì)動(dòng)員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)在提供服務(wù)之日起十個(gè)工作日內(nèi)通過(guò)互聯(lián)網(wǎng)信息服務(wù)算法備案系統(tǒng)填報(bào)服務(wù)提供者的名稱、服務(wù)形式、應(yīng)用領(lǐng)域、算法類型、算法自評(píng)估報(bào)告、擬公示內(nèi)容等信息 方便
湘江鯤鵬目前在人工智能大模型領(lǐng)域擁有算力、數(shù)據(jù)、算法三大關(guān)鍵要素的經(jīng)驗(yàn)積累,構(gòu)建了大模型三個(gè)方面的差異化競(jìng)爭(zhēng)力,盤古大模型AI專業(yè)服務(wù)覆蓋從前期咨詢、規(guī)劃設(shè)計(jì),到數(shù)據(jù)工程、模型訓(xùn)練,再到應(yīng)用工程及模型運(yùn)維的完整流程。基于華為盤古提供的AI專業(yè)服務(wù)包,致力于為企業(yè)提供一站式人工智能解決方案
angChain等流行的大模型開發(fā)框架,構(gòu)建企業(yè)級(jí)AI應(yīng)用;團(tuán)隊(duì)擁有成熟的軟件工程技術(shù)和管理能力。6. 大模型使用的技術(shù)支持,用戶使用大模型平臺(tái),解答用戶使用過(guò)程遇到的問題;大模型與應(yīng)用對(duì)接集成,以及進(jìn)行日常巡檢、故障處理、模型升級(jí)等服務(wù)。4. 工業(yè)數(shù)據(jù)模型(CAD模型、CAE模
太杉天尊大模型AIGC場(chǎng)景解決方案是以AI場(chǎng)景解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。具備自研的行業(yè)模型能力,主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。太杉天尊大模型AIGC場(chǎng)景解決方案,是一款專為滿足政府企
公司集成了世界領(lǐng)先的底層大模型,具備打通跨模型和工具鏈的平臺(tái),提供從需求分析、數(shù)據(jù)收集、模型設(shè)計(jì)、訓(xùn)練優(yōu)化、評(píng)估、系統(tǒng)集成、用戶界面設(shè)計(jì)、部署維護(hù)、合規(guī)性檢查、技術(shù)支持、性能監(jiān)控、擴(kuò)展性設(shè)計(jì)、定制服務(wù)到持續(xù)研發(fā)一站式AI大模型定制研發(fā)服務(wù)。光啟慧語(yǔ)是一家圍繞大模型全棧開展技術(shù)研發(fā)和產(chǎn)
. 模型更新后,將新模型部署至相應(yīng)環(huán)境。 十一、模型評(píng)測(cè)1. 設(shè)計(jì)模型評(píng)測(cè)方案,對(duì)大模型各類指標(biāo)進(jìn)行評(píng)測(cè)。2. 能夠按評(píng)測(cè)標(biāo)準(zhǔn)對(duì)大模型各項(xiàng)能力進(jìn)行打分,輸出大模型評(píng)測(cè)報(bào)告。 十二、Agent開發(fā)1. 基于場(chǎng)景,設(shè)計(jì)并開發(fā)Agent工具。2. 基于langchain等大模型框架,完
數(shù)據(jù)質(zhì)量。4. 模型訓(xùn)練:?設(shè)計(jì)調(diào)優(yōu)方案,實(shí)施模型訓(xùn)練,并進(jìn)行模型評(píng)測(cè)。?熟悉盤古大模型工作流和云服務(wù)操作,確保模型效果優(yōu)化。5. 應(yīng)用工程:?提供基于大模型能力的Agent開發(fā)和應(yīng)用對(duì)接服務(wù)。?具備良好的軟件開發(fā)和溝通能力,實(shí)現(xiàn)大模型與應(yīng)用的無(wú)縫對(duì)接。6. 模型運(yùn)維: ?提供技
天尊大模型AIGC場(chǎng)景解決方案配套服務(wù)是太杉AIGC解決方案的人工服務(wù),是以AI應(yīng)用解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。天尊大模型AIGC場(chǎng)景解決方案配套服務(wù)是太
系統(tǒng)。一、方案概述微簽,以靈敏審批流程和便捷電子簽章為特色,為企業(yè)搭建安全合規(guī)、便捷高效的電子文件簽署和管理平臺(tái)。微簽提供文件電子簽章的六大場(chǎng)景方案:審批流程簽章、實(shí)名驗(yàn)證簽章、自己簽章、批量自動(dòng)簽章、虛擬打印簽章、系統(tǒng)集成簽章。 二、審批流程簽章文件要審核后簽字蓋章?用審批電子
華為云盤古大模型 華為云盤古大模型 AI for Industries 大模型重塑千行百業(yè) AI for Industries 大模型重塑千行百業(yè) 盤古大模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識(shí)know-how與大模型能力相結(jié)合
ModelArts支持本地準(zhǔn)備模型包,編寫模型配置文件和模型推理代碼,將準(zhǔn)備好的模型包上傳至對(duì)象存儲(chǔ)服務(wù)OBS,從OBS導(dǎo)入模型創(chuàng)建為AI應(yīng)用。 制作模型包,則需要符合一定的模型包規(guī)范。模型包里面必需包含“model”文件夾,“model”文件夾下面放置模型文件,模型配置文件,模型推理代碼文件。
ModelArts-AI開發(fā)流程 ModelArts 與 ModelArts Studio 對(duì)比:全場(chǎng)景平臺(tái) vs 大模型「超級(jí)工廠」 查看更多 收起
DeepSeek-R1蒸餾模型部署及體驗(yàn) DeepSeek-R1蒸餾模型部署及體驗(yàn) 在MaaS平臺(tái)上,DeepSeek-R1蒸餾模型已經(jīng)部署上線,開發(fā)者可以通過(guò)在線體驗(yàn)或API調(diào)用來(lái)使用這些模型。開發(fā)者可以在MaaS平臺(tái)上輕松部署和使用這些模型,以滿足不同場(chǎng)景下的需求。 在Maa
的元模型需要符合模型包規(guī)范。 模型包規(guī)范 ModelArts推理部署,模型包里面必需包含“model”文件夾,“model”文件夾下面放置模型文件,模型配置文件,模型推理代碼文件。 • 模型文件:在不同模型包結(jié)構(gòu)中模型文件的要求不同,具體請(qǐng)參見模型包結(jié)構(gòu)示例。 • 模型配置文件:
ModelArts模型訓(xùn)練 ModelArts模型訓(xùn)練簡(jiǎn)介 ModelArts模型訓(xùn)練,俗稱“建模”,指通過(guò)分析手段、方法和技巧對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目的提供決策參考。訓(xùn)練模型的結(jié)果通常是一個(gè)或多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型,模型可以應(yīng)用到新的數(shù)據(jù)中,得到預(yù)測(cè)、評(píng)價(jià)等結(jié)果。
ModelArts推理部署,使用容器鏡像創(chuàng)建AI應(yīng)用,需要提前在本地開發(fā)模型,制作自定義鏡像,上傳至容器鏡像SWR服務(wù),制作AI應(yīng)用的自定義鏡像需滿足ModelArts定義的規(guī)范。 ModelArts推理部署,使用容器鏡像創(chuàng)建AI應(yīng)用,需要提前在本地開發(fā)模型,制作自定義鏡像,上傳
免費(fèi)AI客服電話-云蝠智能AI客戶聯(lián)絡(luò)中心 免費(fèi)AI客服電話-云蝠智能AI客戶聯(lián)絡(luò)中心 “云蝠智能”企業(yè)提供AI客戶聯(lián)絡(luò)中心,包含智能語(yǔ)音電話機(jī)器人、智能語(yǔ)音呼叫、短信分發(fā)及企業(yè)微信SCRM的業(yè)務(wù)體系。通過(guò)提供AI會(huì)員回訪、通知、精準(zhǔn)營(yíng)銷的系統(tǒng)進(jìn)行產(chǎn)品服務(wù)和賦能。 “云蝠智能”企
第三彈:數(shù)據(jù)實(shí)例的連接 華為云GaussDB Ustore存儲(chǔ)引擎正式發(fā)布 華為云GaussDB專場(chǎng)直播第5期:SQL優(yōu)化解讀 華為云GaussDB發(fā)布5大核心技術(shù),打造行業(yè)領(lǐng)先的技術(shù)競(jìng)爭(zhēng)力 客戶案例 為什么他們選擇了GaussDB “星河”數(shù)據(jù)庫(kù)標(biāo)桿案例!工商銀行&華為云GaussDB再創(chuàng)佳績(jī)
ai大模型本地部署
在線推理是指利用部署在遠(yuǎn)程服務(wù)器或云平臺(tái)上的 AI/機(jī)器學(xué)習(xí)模型,通過(guò)網(wǎng)絡(luò)接收用戶輸入的數(shù)據(jù)或問題,并實(shí)時(shí)返回處理結(jié)果或決策的過(guò)程。在線推理是一種基于云端模型的實(shí)時(shí)交互式服務(wù),提供低延遲、高可用性的 AI 智能服務(wù),讓用戶無(wú)需本地部署復(fù)雜模型即可獲得強(qiáng)大的分析、預(yù)測(cè)、理解等能力,適用于需要快速響應(yīng)和交互的場(chǎng)景。
ModelArts 提供在線部署功能,支持將模型部署為一個(gè)Web Service,并且提供在線的測(cè)試UI與監(jiān)控功能。部署成功的在線服務(wù)會(huì)提供一個(gè)可調(diào)用的API,您可以對(duì)部署成功的在線服務(wù)進(jìn)行預(yù)測(cè)和調(diào)用。在線推理常用于對(duì)實(shí)時(shí)性要求較高的場(chǎng)景,如在線智能客服、自動(dòng)駕駛中的實(shí)時(shí)決策等。
本章節(jié)主要介紹如何在ModelArts部署模型為在線服務(wù),并對(duì)部署成功的在線服務(wù)進(jìn)行預(yù)測(cè)。
計(jì)費(fèi)說(shuō)明
在ModelArts進(jìn)行服務(wù)部署時(shí),會(huì)產(chǎn)生計(jì)算資源和存儲(chǔ)資源的累計(jì)值計(jì)費(fèi)。計(jì)算資源為運(yùn)行推理服務(wù)的費(fèi)用。存儲(chǔ)資源包括數(shù)據(jù)存儲(chǔ)到 OBS 的計(jì)費(fèi)。具體內(nèi)容如表1所示。
|
計(jì)費(fèi)項(xiàng) |
計(jì)費(fèi)項(xiàng)說(shuō)明 |
適用的計(jì)費(fèi)模式 |
計(jì)費(fèi)公式 |
|
|---|---|---|---|---|
|
計(jì)算資源 |
公共資源池 |
使用計(jì)算資源的用量。 具體費(fèi)用可參見ModelArts價(jià)格詳情。 |
按需計(jì)費(fèi) |
規(guī)格單價(jià) * 計(jì)算節(jié)點(diǎn)個(gè)數(shù) * 使用時(shí)長(zhǎng) |
|
專屬資源池 |
專屬資源池的費(fèi)用已在購(gòu)買時(shí)支付,部署服務(wù)不再收費(fèi)。 專屬資源池的費(fèi)用請(qǐng)參考專屬資源池計(jì)費(fèi)項(xiàng)。 |
- |
- |
|
|
事件通知(不開啟則不計(jì)費(fèi)) |
訂閱消息使用 消息通知 服務(wù),在事件列表中選擇特定事件,在事件發(fā)生時(shí)發(fā)送消息通知。 如果想使用消息通知,需要在創(chuàng)建訓(xùn)練作業(yè)時(shí)開啟“事件通知”功能。 具體計(jì)費(fèi)可見消息通知服務(wù)價(jià)格詳情。 |
按實(shí)際用量付費(fèi) |
|
|
|
運(yùn)行日志(不開啟則不計(jì)費(fèi)) |
由 云日志 服務(wù)( LTS )提供日志收集、分析、存儲(chǔ)等服務(wù)。 部署服務(wù)時(shí),開啟“運(yùn)行日志輸出”后,日志數(shù)據(jù)超出LTS免費(fèi)額度后,會(huì)產(chǎn)生費(fèi)用。具體可云日志服務(wù)價(jià)格詳情 |
按實(shí)際日志量付費(fèi) |
超過(guò)免費(fèi)額度后,按實(shí)際日志存儲(chǔ)量和存儲(chǔ)時(shí)長(zhǎng)收費(fèi) |
|
約束與限制
單個(gè)用戶最多可創(chuàng)建20個(gè)在線服務(wù)。
前提條件
- 數(shù)據(jù)已完成準(zhǔn)備:已在ModelArts中創(chuàng)建狀態(tài)“正?!?/span>可用的模型,模型創(chuàng)建請(qǐng)見創(chuàng)建模型。
- 由于在線運(yùn)行需消耗資源,確保賬戶未欠費(fèi)。
- 在線服務(wù)使用 SFS Turbo掛載時(shí)需要?jiǎng)?chuàng)建并關(guān)聯(lián)SFS Turbo,具體操作如下。
- 創(chuàng)建SFS Turbo,詳情請(qǐng)見創(chuàng)建SFS Turbo。
- 在“標(biāo)準(zhǔn)算力集群(Standard Cluster)”頁(yè)面單擊資源池名稱,查看部署服務(wù)需要選擇的資源池詳情,復(fù)制“網(wǎng)絡(luò)”字段對(duì)應(yīng)的值。
- 退出詳情后,單擊“網(wǎng)絡(luò)管理”頁(yè)面,按剛復(fù)制的網(wǎng)絡(luò)信息搜索,單擊“打通 VPC ”選擇自己SFS Turbo所在的VPC以及子網(wǎng)后單擊“確定”。
或者通過(guò)單擊“更多”頁(yè)簽后選擇“關(guān)聯(lián)SFS Turbo”選擇自己需要掛載的SFS Turbo,該步驟存在規(guī)格要求需要SFS Turbo的 ECS 規(guī)格支持多個(gè)網(wǎng)卡,否則會(huì)提示掛網(wǎng)卡失敗。
部署在線服務(wù)(同步請(qǐng)求)
- 登錄ModelArts管理控制臺(tái),在左側(cè)導(dǎo)航欄中選擇“模型部署 > 在線服務(wù)”,默認(rèn)進(jìn)入“在線服務(wù)”列表。
- 在“在線服務(wù)”列表中,單擊左上角“部署”,進(jìn)入“部署”頁(yè)面。
- 在“部署”頁(yè)面,填寫在線服務(wù)相關(guān)參數(shù)。
- 填寫基本信息,詳細(xì)參數(shù)說(shuō)明請(qǐng)參見表2。
表2 基本信息參數(shù)說(shuō)明 參數(shù)名稱
說(shuō)明
“名稱”
在線服務(wù)的名稱,請(qǐng)按照界面提示規(guī)則填寫。
“是否自動(dòng)停止”
啟用該參數(shù)并設(shè)置時(shí)間后,服務(wù)將在指定時(shí)間后自動(dòng)停止。如果不啟用此參數(shù),在線服務(wù)將一直運(yùn)行,同時(shí)一直收費(fèi),自動(dòng)停止功能可以幫您避免產(chǎn)生不必要的費(fèi)用。默認(rèn)開啟自動(dòng)停止功能,且默認(rèn)值為“1小時(shí)”。
目前支持設(shè)置為“1小時(shí)”、“2小時(shí)”、“4小時(shí)”、“6小時(shí)”、“自定義”。如果選擇“自定義”的模式,可在右側(cè)輸入框中輸入1~24范圍內(nèi)的任意整數(shù)。
“描述”
在線服務(wù)的簡(jiǎn)要說(shuō)明。
- 填寫資源池和模型配置等關(guān)鍵信息,詳情請(qǐng)參見表3。
表3 參數(shù)說(shuō)明 參數(shù)名稱
子參數(shù)
說(shuō)明
“資源池”
“公共資源池”
部署在線服務(wù)使用公共資源池。公共資源池提供公共的大規(guī)模計(jì)算集群,根據(jù)用戶作業(yè)參數(shù)分配使用,資源按作業(yè)隔離。
公共資源池有CPU或GPU兩種規(guī)格,不同規(guī)格的資源池,其收費(fèi)標(biāo)準(zhǔn)不同,詳情請(qǐng)參見價(jià)格詳情說(shuō)明。當(dāng)前僅支持按需付費(fèi)模式。
“專屬資源池”
部署在線服務(wù)使用專屬資源池。專屬資源池不與其他用戶共享,資源更可控。
在專屬資源池規(guī)格中選擇對(duì)應(yīng)的規(guī)格進(jìn)行使用。暫不支持選擇創(chuàng)建了邏輯子池的物理池。
“選擇模型及配置”
“模型來(lái)源”
部署在線服務(wù)的模型來(lái)源。根據(jù)您的實(shí)際情況選擇“自定義模型”或者“訂閱模型”。
- “自定義模型”:在ModelArts自行訓(xùn)練或本地開發(fā)并導(dǎo)入ModelArts的模型。
- “訂閱模型”:從AI Gallery中訂閱官方發(fā)布或者他人分享的模型。
“模型及版本”
選擇狀態(tài)“正?!?/span>的模型及版本。
“分流”
設(shè)置當(dāng)前模型版本的流量占比,服務(wù)調(diào)用請(qǐng)求根據(jù)該比例分配到當(dāng)前版本上
如您僅部署一個(gè)版本的模型,請(qǐng)?jiān)O(shè)置為100%。如您添加多個(gè)版本進(jìn)行灰度發(fā)布,多個(gè)版本分流之和設(shè)置為100%。
“實(shí)例規(guī)格”
選擇部署在線服務(wù)的實(shí)例規(guī)格,確保在線服務(wù)能夠正常運(yùn)行。
請(qǐng)根據(jù)界面顯示的列表,選擇可用的規(guī)格,置灰的規(guī)格表示當(dāng)前環(huán)境無(wú)法使用。
如果公共資源池下規(guī)格為空數(shù)據(jù),表示當(dāng)前環(huán)境無(wú)公共資源。建議使用專屬資源池。
使用所選規(guī)格部署服務(wù)時(shí),會(huì)產(chǎn)生必要的系統(tǒng)消耗,因此服務(wù)實(shí)際占用的資源會(huì)略大于該規(guī)格。
“實(shí)例數(shù)”
設(shè)置當(dāng)前版本模型的實(shí)例個(gè)數(shù)。如果實(shí)例數(shù)設(shè)置為1,表示后臺(tái)的計(jì)算模式是單機(jī)模式;如果實(shí)例數(shù)設(shè)置大于1,表示后臺(tái)的計(jì)算模式為分布式的。請(qǐng)根據(jù)實(shí)際編碼情況選擇計(jì)算模式。
“環(huán)境變量”
設(shè)置環(huán)境變量,注入環(huán)境變量到容器實(shí)例。
為確保您的數(shù)據(jù)安全,在環(huán)境變量中,請(qǐng)勿輸入敏感信息,如明文密碼。
“部署超時(shí)時(shí)間”
用于設(shè)置單個(gè)模型實(shí)例的超時(shí)時(shí)間,包括部署和啟動(dòng)時(shí)間。默認(rèn)值為20分鐘,輸入值必須在3到120之間。
“添加模型版本進(jìn)行灰度發(fā)布”
當(dāng)選擇的模型有多個(gè)版本時(shí),您可以添加多個(gè)模型版本,并通過(guò)配置“分流”參數(shù)配置各模型版本的分流占比,完成多版本和靈活流量策略的灰度發(fā)布,實(shí)現(xiàn)模型版本的平滑過(guò)渡升級(jí)。
當(dāng)前免費(fèi)計(jì)算規(guī)格不支持多版本灰度發(fā)布。
“存儲(chǔ)掛載”
資源池為專屬資源池時(shí)顯示該參數(shù)。在服務(wù)運(yùn)行時(shí)將存儲(chǔ)卷以本地目錄的方式掛載到計(jì)算節(jié)點(diǎn)(計(jì)算實(shí)例),模型或輸入數(shù)據(jù)較大時(shí)建議使用。
SFS Turbo:
使用SFS Turbo掛載準(zhǔn)備工作如下:
使用專屬資源池部署服務(wù)才允許使用存儲(chǔ)掛載的能力,并且專屬資源池需要打通VPC或關(guān)聯(lián)SFS Turbo。
- 打通VPC為打通SFS Turbo所在VPC和專屬資源池網(wǎng)絡(luò),打通步驟請(qǐng)見打通VPC章節(jié)。
- 關(guān)聯(lián)SFS Turbo:如果SFS Turbo為HPC型的文件系統(tǒng),可使用關(guān)聯(lián)SFS Turbo功能,具體操作請(qǐng)參見配置ModelArts和SFS Turbo間網(wǎng)絡(luò)直通。
參數(shù)說(shuō)明如下:
- “文件系統(tǒng)名稱”:選擇對(duì)應(yīng)的SFS Turbo極速文件。不支持選擇跨區(qū)域(Region)的極速文件系統(tǒng)。
- “掛載路徑”:指定容器內(nèi)部的掛載路徑,如“/sfs-turbo-mount/”。請(qǐng)選擇全新目錄,選擇存量目錄會(huì)覆蓋存量文件。
注意事項(xiàng)如下:
- 相同的文件系統(tǒng)只能掛載一次 ,且只能對(duì)應(yīng)一個(gè)掛載路徑,掛載路徑均不可重復(fù)。最多可以掛載8個(gè)盤。
- 選擇多掛載時(shí)請(qǐng)勿設(shè)置存在沖突的掛載路徑如相同路徑或相似路徑如/obs-mount/與/obs-mount/tmp/等。
- 選擇SFS Turbo存儲(chǔ)掛載后,請(qǐng)勿刪除已經(jīng)打通的VPC或解除SFS Turbo關(guān)聯(lián),否則會(huì)導(dǎo)致掛載功能無(wú)法使用。掛載時(shí)默認(rèn)按客戶端umask權(quán)限設(shè)置,為確保正常使用須在SFS Turbo界面綁定后端OBS存儲(chǔ)后設(shè)置權(quán)限為777。
優(yōu)先級(jí)
-
該功能僅在專屬資源池生效,包括邏輯資源池/新創(chuàng)建的物理資源池/邏輯子池,存量物理資源池不支持此功能。
用戶可以通過(guò)設(shè)置優(yōu)先級(jí),優(yōu)先保障高優(yōu)先級(jí)的業(yè)務(wù)調(diào)度。
優(yōu)先級(jí)可選[1-3],1為最低優(yōu)先級(jí),3為最高優(yōu)先級(jí)。訓(xùn)推共池時(shí),在創(chuàng)建訓(xùn)練作業(yè)界面開啟“允許被搶占”后(參考創(chuàng)建訓(xùn)練作業(yè)的創(chuàng)建生產(chǎn)訓(xùn)練作業(yè)(新版頁(yè)面)),高優(yōu)先級(jí)的推理任務(wù)可以搶占低優(yōu)先級(jí)的訓(xùn)練作業(yè)。
“服務(wù)流量限制”
-
服務(wù)流量限制是指每秒內(nèi)一個(gè)服務(wù)能夠被訪問的次數(shù)上限。您可以根據(jù)實(shí)際需求設(shè)置每秒流量限制。
“升級(jí)為WebSocket”
-
設(shè)置在線服務(wù)是否部署為WebSocket服務(wù)。將服務(wù)的通信協(xié)議從HTTP/HTTPS升級(jí)為WebSocket協(xié)議。
WebSocket協(xié)議支持客戶端和服務(wù)端之間的雙向?qū)崟r(shí)通信,適用于需要實(shí)時(shí)交互的場(chǎng)景,如實(shí)時(shí)預(yù)測(cè)、聊天機(jī)器人等。
升級(jí)為WebSocket后,服務(wù)的API接口公網(wǎng)地址將變?yōu)閃ebSocket協(xié)議地址,客戶端可以通過(guò)WebSocket客戶端進(jìn)行連接和數(shù)據(jù)交互。
約束限制如下:
要求模型的元模型來(lái)源為從 容器鏡像 中選擇,并且 鏡像 支持WebSocket。
設(shè)置“升級(jí)為WebSocket”后,不支持設(shè)置“服務(wù)流量限制”。
“升級(jí)為WebSocket”參數(shù)配置,在部署服務(wù)后不支持修改。
在線服務(wù)支持WebSocket更多了解請(qǐng)參考WebSocket在線服務(wù)全流程開發(fā)。
“運(yùn)行日志輸出”
-
默認(rèn)關(guān)閉,在線服務(wù)的運(yùn)行日志僅存放在ModelArts日志系統(tǒng),在服務(wù)詳情頁(yè)的“日志”支持簡(jiǎn)單查詢。
如果開啟此功能,在線服務(wù)的運(yùn)行日志會(huì)輸出存放到 云日志服務(wù)LTS 。LTS自動(dòng)創(chuàng)建日志組和日志流,默認(rèn)緩存7天內(nèi)的運(yùn)行日志。如需了解LTS專業(yè)日志管理功能,請(qǐng)參見云日志服務(wù)。
開啟此功能后約束限制如下:
- “運(yùn)行日志輸出”開啟后,在部署服務(wù)后不支持關(guān)閉。
- 請(qǐng)勿打印無(wú)用的audio日志文件,這會(huì)導(dǎo)致系統(tǒng)日志卡死,無(wú)法正常顯示日志,可能會(huì)出現(xiàn)“Failed to load audio”的報(bào)錯(cuò)。
注意:LTS服務(wù)提供的日志查詢和日志存儲(chǔ)功能涉及計(jì)費(fèi),詳細(xì)請(qǐng)參見了解LTS的計(jì)費(fèi)規(guī)則。
“支持APP認(rèn)證”
“APP授權(quán)配置”
在線服務(wù)是否支持通過(guò)APP認(rèn)證進(jìn)行訪問控制。
APP認(rèn)證是一種基于AppCode和AppSecret的認(rèn)證方式,用于驗(yàn)證客戶端的身份,確保只有授權(quán)的APP能夠調(diào)用服務(wù)的API。
通過(guò)APP認(rèn)證,可以實(shí)現(xiàn)更細(xì)粒度的訪問控制,提升服務(wù)的安全性。
默認(rèn)關(guān)閉。如需開啟此功能,請(qǐng)參見通過(guò)APP認(rèn)證的方式訪問在線服務(wù)了解詳情并根據(jù)實(shí)際情況進(jìn)行設(shè)置。
“訂閱消息”
-
訂閱消息使用消息通知服務(wù),在事件列表中選擇需要監(jiān)控的服務(wù)狀態(tài),在事件發(fā)生時(shí)發(fā)送消息通知。
- 可選:配置高級(jí)選項(xiàng)。
表4 高級(jí)選項(xiàng)參數(shù)說(shuō)明 參數(shù)名稱
說(shuō)明
故障自動(dòng)重啟
服務(wù)實(shí)例在發(fā)生故障時(shí)是否自動(dòng)重啟。
開啟該功能后,系統(tǒng)檢測(cè)到在線服務(wù)異常,會(huì)自動(dòng)重新部署在線服務(wù)。詳細(xì)請(qǐng)參見設(shè)置在線服務(wù)故障自動(dòng)重啟。
自動(dòng)重啟功能可以有效提升服務(wù)的可用性和穩(wěn)定性,減少因硬件故障導(dǎo)致的服務(wù)中斷時(shí)間。適用于對(duì)服務(wù)連續(xù)性和穩(wěn)定性要求較高的場(chǎng)景。
“支持IPV6”
服務(wù)實(shí)例是否支持IPv6網(wǎng)絡(luò)通信。
默認(rèn)關(guān)閉。開啟該功能后,待在線服務(wù)部署完成,服務(wù)預(yù)測(cè)地址中的域名在公網(wǎng)解析時(shí)可解析為IPV6地址。
當(dāng)需要通過(guò)IPv6地址訪問服務(wù)實(shí)例時(shí),開啟此字段以支持IPv6網(wǎng)絡(luò)通信。適用于需要在全球范圍內(nèi)提供服務(wù),或需要與支持IPv6的網(wǎng)絡(luò)環(huán)境對(duì)接的場(chǎng)景。
該功能約束限制如下:
- 僅支持部署時(shí)開啟,開啟后不支持修改。
- 僅北京四支持該功能。
“標(biāo)簽”
ModelArts支持對(duì)接標(biāo)簽管理服務(wù)TMS,在ModelArts中創(chuàng)建資源消耗性任務(wù)(例如:創(chuàng)建Notebook、訓(xùn)練作業(yè)、推理在線服務(wù))時(shí),可以為這些任務(wù)配置標(biāo)簽,通過(guò)標(biāo)簽實(shí)現(xiàn)資源的多維分組管理。
可以在標(biāo)簽輸入框下拉選擇TMS預(yù)定義標(biāo)簽,也可以自己輸入自定義標(biāo)簽。預(yù)定義標(biāo)簽對(duì)所有支持標(biāo)簽功能的服務(wù)資源可見。租戶自定義標(biāo)簽只對(duì)自己服務(wù)可見。
標(biāo)簽詳細(xì)用法請(qǐng)參見ModelArts如何通過(guò)標(biāo)簽實(shí)現(xiàn)資源分組管理。
- 填寫基本信息,詳細(xì)參數(shù)說(shuō)明請(qǐng)參見表2。
- 確認(rèn)填寫信息無(wú)誤后,根據(jù)界面提示完成在線服務(wù)的部署。部署服務(wù)一般需要運(yùn)行一段時(shí)間,根據(jù)您選擇的數(shù)據(jù)量和資源不同,部署時(shí)間將耗時(shí)幾分鐘到幾十分鐘不等。
您可以前往在線服務(wù)列表,查看在線服務(wù)的基本情況。在線服務(wù)列表中,剛部署的服務(wù)“狀態(tài)”為“部署中”,當(dāng)在線服務(wù)的“狀態(tài)”變?yōu)?span id="9tlxrzz" class="parmname" id="ZH-CN_TOPIC_0000001986022709__zh-cn_topic_0165025304_parmname14442124095518">“運(yùn)行中”時(shí),表示服務(wù)部署完成。
在線服務(wù)部署完成后,將立即啟動(dòng)。服務(wù)為“運(yùn)行中”,“告警”狀態(tài)下正常運(yùn)行實(shí)例正在產(chǎn)生費(fèi)用,不使用時(shí),請(qǐng)及時(shí)停止。
使用預(yù)測(cè)功能測(cè)試在線服務(wù)
模型部署為在線服務(wù)成功后,您可以在“預(yù)測(cè)”頁(yè)簽進(jìn)行代碼調(diào)試或添加文件測(cè)試。因APIG(API網(wǎng)關(guān))的限制,單次預(yù)測(cè)的時(shí)間不能超過(guò)40S。
該功能為調(diào)測(cè)使用,實(shí)際生產(chǎn)建議使用API調(diào)用。根據(jù)鑒權(quán)方式的不同,可以根據(jù)實(shí)際情況選擇通過(guò)Token認(rèn)證的方式訪問在線服務(wù)、通過(guò)AK/SK認(rèn)證的方式訪問在線服務(wù)或者通過(guò)APP認(rèn)證的方式訪問在線服務(wù)。
根據(jù)模型定義的輸入請(qǐng)求不同(JSON文本或文件),測(cè)試服務(wù)包括如下兩種方式:
- JSON文本預(yù)測(cè):如當(dāng)前部署服務(wù)的模型,其輸入類型指定的為JSON文本類,即不含有文件類型的輸入,可以在“預(yù)測(cè)”頁(yè)簽輸入JSON代碼進(jìn)行服務(wù)預(yù)測(cè)。
- 文件預(yù)測(cè):如當(dāng)前部署服務(wù)的模型,其輸入類型指定為文件類,可包含圖片、音頻或視頻等場(chǎng)景,可以在“預(yù)測(cè)”頁(yè)簽添加圖片進(jìn)行服務(wù)預(yù)測(cè)。
- 如果您的輸入類型為圖片,請(qǐng)注意測(cè)試服務(wù)單張圖片輸入應(yīng)小于8MB。
- JSON文本預(yù)測(cè),請(qǐng)求體的大小不超過(guò)8MB。
- 因APIG(API網(wǎng)關(guān))的限制,單次預(yù)測(cè)的時(shí)間不能超過(guò)40S。
- 圖片支持以下類型:“png”、“psd”、“jpg”、“jpeg”、“bmp”、“gif”、“webp”、“psd”、“svg”、“tiff”。
- 如果服務(wù)部署時(shí)使用的是“Ascend”規(guī)格,則無(wú)法預(yù)測(cè)含有透明度的PNG圖片,因?yàn)锳scend僅支持RGB-3通道的圖片。
針對(duì)您部署上線的服務(wù),您可以在服務(wù)詳情頁(yè)面的“調(diào)用指南”中,了解本服務(wù)的輸入?yún)?shù),即上文提到的輸入請(qǐng)求類型。
調(diào)用指南中的輸入?yún)?shù)取決于您選擇的模型來(lái)源:
- 如果您的元模型來(lái)源于預(yù)置算法,其輸入輸出參數(shù)由ModelArts官方定義,請(qǐng)直接參考“調(diào)用指南”中的說(shuō)明,并在預(yù)測(cè)頁(yè)簽中輸入對(duì)應(yīng)的JSON文本或文件進(jìn)行服務(wù)測(cè)試。
- 如果您的元模型是自定義的,即推理代碼和配置文件是自行編寫的(配置文件編寫說(shuō)明),“調(diào)用指南”只是將您編寫的配置文件進(jìn)行了可視化展示。調(diào)用指南的輸入?yún)?shù)與配置文件對(duì)應(yīng)關(guān)系如下所示。
圖2 配置文件與調(diào)用指南的對(duì)應(yīng)關(guān)系
不同輸入請(qǐng)求的預(yù)測(cè)方式如下:
- JSON文本預(yù)測(cè)
- 登錄ModelArts管理控制臺(tái),在左側(cè)菜單欄中選擇“模型部署 > 在線服務(wù)”,進(jìn)入“在線服務(wù)”管理頁(yè)面。
- 單擊目標(biāo)服務(wù)名稱,進(jìn)入服務(wù)詳情頁(yè)面。在“預(yù)測(cè)”頁(yè)簽的預(yù)測(cè)代碼下,輸入預(yù)測(cè)代碼,然后單擊“預(yù)測(cè)”即可進(jìn)行服務(wù)的預(yù)測(cè),如圖3所示。
JSON文本類的預(yù)測(cè)代碼和返回結(jié)果樣例如下所示。
- 文件預(yù)測(cè)
- 登錄ModelArts管理控制臺(tái),在左側(cè)菜單欄中選擇“模型部署 > 在線服務(wù)”,進(jìn)入“在線服務(wù)”管理頁(yè)面。
- 單擊目標(biāo)服務(wù)名稱,進(jìn)入服務(wù)詳情頁(yè)面。在“預(yù)測(cè)”頁(yè)簽,單擊“上傳”,然后選擇測(cè)試文件。文件上傳成功后,單擊“預(yù)測(cè)”即可進(jìn)行服務(wù)的預(yù)測(cè),如圖4所示,輸出標(biāo)簽名稱,以及位置坐標(biāo)和檢測(cè)的評(píng)分。
文件類的預(yù)測(cè)代碼和返回結(jié)果樣例,可參見花卉識(shí)別樣例。此樣例是使用訂閱算法訓(xùn)練的元模型,其輸入類型為ModelArts官方定義,不可更改,如需自定義的元模型,請(qǐng)參見手寫數(shù)字識(shí)別樣例。
使用CloudShell調(diào)試在線服務(wù)實(shí)例容器
允許用戶使用ModelArts控制臺(tái)提供的CloudShell登錄運(yùn)行中在線服務(wù)實(shí)例容器。
約束限制:
- 只支持專屬資源池部署的在線服務(wù)使用CloudShell訪問容器。
- 在線服務(wù)必須處于“運(yùn)行中”狀態(tài),才支持CloudShell訪問容器。
- 登錄ModelArts管理控制臺(tái),左側(cè)菜單選擇“模型部署 > 在線服務(wù)”。
- 在線服務(wù)列表頁(yè)面單擊“名稱/ID”,進(jìn)入在線服務(wù)詳情頁(yè)面。
- 單擊CloudShell頁(yè)簽,選擇模型版本和計(jì)算節(jié)點(diǎn),當(dāng)連接狀態(tài)變?yōu)?span>
時(shí),即登錄實(shí)例容器成功。
如果遇到異常情況服務(wù)器主動(dòng)斷開或超過(guò)10分鐘未操作自動(dòng)斷開,此時(shí)可單擊“重新連接”重新登錄實(shí)例容器。圖5 CloudShell界面
部分用戶登錄Cloud Shell界面時(shí),可能會(huì)出現(xiàn)路徑顯示異常情況,此時(shí)在Cloud Shell中單擊回車鍵即可恢復(fù)正常。圖6 路徑異常
- 登錄實(shí)例容器成功后,在容器的終端環(huán)境執(zhí)行所需的調(diào)試命令。例如:
查看日志:
tail -f /var/log/app.log
檢查服務(wù)狀態(tài):
systemctl status app
執(zhí)行自定義腳本:
./debug_script.sh
- 完成調(diào)試后,使用以下命令退出容器:
exit
返回CloudShell終端后,您可以查看調(diào)試結(jié)果或日志文件。
常見問題
- 服務(wù)部署失敗
- 服務(wù)預(yù)測(cè)失敗
ai大模型本地部署常見問題
更多常見問題 >>-
盤古大模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識(shí)know-how與大模型能力相結(jié)合,重塑千行百業(yè),成為各組織、企業(yè)、個(gè)人的專家助手。
-
近年來(lái)越來(lái)越多的行業(yè)采用AI技術(shù)提升效率、降低成本,然而AI落地的過(guò)程確并不容易,AI在具體與業(yè)務(wù)結(jié)合時(shí)常常依賴于業(yè)務(wù)數(shù)據(jù)的采集、處理、模型訓(xùn)練、調(diào)優(yōu)、編排、部署和運(yùn)維等很多環(huán)節(jié)。華為云ModelArts是全流程AI開發(fā)平臺(tái),包含了AI應(yīng)用的開發(fā)、部署和分享交易,通過(guò)解決AI開發(fā)各個(gè)環(huán)節(jié)所遇到的核心問題,ModelArts有效解決了AI落地難的問題,將極大促進(jìn)AI技術(shù)的普惠。本議題將分享ModelArts的主要關(guān)鍵技術(shù)和應(yīng)用案例。
-
ModelArts是一個(gè)一站式的開發(fā)平臺(tái),能夠支撐開發(fā)者從數(shù)據(jù)到AI應(yīng)用的全流程開發(fā)過(guò)程。包含數(shù)據(jù)處理、模型訓(xùn)練、模型管理、模型部署等操作,并且提供AI Gallery功能,能夠在市場(chǎng)內(nèi)與其他開發(fā)者分享模型。
-
模型轉(zhuǎn)換,即將開源框架的網(wǎng)絡(luò)模型(如Caffe、TensorFlow等),通過(guò)ATC(Ascend Tensor Compiler)模型轉(zhuǎn)換工具,將其轉(zhuǎn)換成昇騰AI處理器支持的離線模型。
-
企業(yè)ERP上云通用解決方案提供ERP軟件及云上架構(gòu),助力企業(yè)ERP一站式上云,ERP云上部署優(yōu)勢(shì):減低成本,提升企業(yè)管理效率,助力企業(yè)數(shù)字化轉(zhuǎn)型。
-
本次Serverless應(yīng)用中心上線文生圖應(yīng)用,用戶無(wú)需下載源代碼、了解各種安裝部署知識(shí)、安裝復(fù)雜的依賴,通過(guò)華為云Serverless應(yīng)用中心即可一鍵創(chuàng)建AI文生圖應(yīng)用,體驗(yàn) “0” 構(gòu)建門檻、“0” 資源閑置并具備極致彈性的Serverless AI繪圖能力。
ai大模型本地部署教程視頻
最佳實(shí)踐視頻幫助您快速了解搭建流程 了解更多
更多相關(guān)專題
- 熱門產(chǎn)品
- 大模型即服務(wù)平臺(tái) MaaS
- Flexus云服務(wù)
- 云服務(wù)器
- 盤古大模型
- SSL證書
- 華為云WeLink
- 實(shí)用工具
- 文字識(shí)別
- 漏洞掃描
- 華為云會(huì)議
- 云服務(wù)健康看板
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:B1.B2-20200593 | 域名注冊(cè)服務(wù)機(jī)構(gòu)許可:黔D3-20230001 | 代理域名注冊(cè)服務(wù)機(jī)構(gòu):新網(wǎng)、西數(shù)

