檢測(cè)到您已登錄華為云國(guó)際站賬號(hào),為了您更好的體驗(yàn),建議您訪問(wèn)國(guó)際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
一,模型在線部署 深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)方向除了算法訓(xùn)練/研究,還有兩個(gè)重要的方向: 模型壓縮(模型優(yōu)化、量化)、模型部署(模型轉(zhuǎn)換、后端功能SDK開(kāi)發(fā))。所謂模型部署,即將算法研究員訓(xùn)練出的模型部署到具體的端邊云芯片平臺(tái)上,并完成特定業(yè)務(wù)的視頻結(jié)構(gòu)化應(yīng)用開(kāi)發(fā)。 現(xiàn)階段的平臺(tái)主要分為云平臺(tái)(如英偉達(dá)
場(chǎng)景與模型組合請(qǐng)見(jiàn)表2。 部署方式 支持“云上部署”和“邊緣部署”,其中,云上部署指算法部署至平臺(tái)提供的資源池中。邊緣部署指算法部署至客戶(hù)的邊緣設(shè)備中(僅支持邊緣部署的模型可配置邊緣部署)。 部分模型資產(chǎn)支持邊緣部署方式,若選擇“邊緣部署”: 本地掛載路徑(選填):在容器內(nèi)部將卷
管理NLP大模型部署任務(wù) 模型更新 完成創(chuàng)建NLP大模型部署任務(wù)后,可以替換已部署的模型并升級(jí)配置,具體步驟如下: 登錄ModelArts Studio大模型開(kāi)發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,單擊模型名稱(chēng),進(jìn)入模型詳情頁(yè)面。
管理CV大模型部署任務(wù) 模型更新 完成創(chuàng)建CV大模型部署任務(wù)后,可以替換已部署的模型并升級(jí)配置,具體步驟如下: 登錄ModelArts Studio大模型開(kāi)發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,單擊模型名稱(chēng),進(jìn)入模型詳情頁(yè)面。
以查看模型的部署狀態(tài)。 當(dāng)狀態(tài)顯示為“運(yùn)行中”時(shí),表示模型已成功部署。此過(guò)程可能需要較長(zhǎng)時(shí)間,請(qǐng)耐心等待。 單擊模型名稱(chēng)進(jìn)入詳情頁(yè),查看模型的部署詳情、部署事件、部署日志等信息。 圖2 部署詳情 父主題: 部署NLP大模型
查看預(yù)測(cè)大模型部署任務(wù)詳情 部署任務(wù)創(chuàng)建成功后,可以查看大模型部署的任務(wù)詳情,具體步驟如下: 登錄ModelArts Studio大模型開(kāi)發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,完成創(chuàng)建預(yù)測(cè)大模型部署任務(wù)后,可以查看模型的部署狀態(tài)。
\venv\Scripts\activate安裝 Flask 和 Waitress:如果你還沒(méi)有安裝 Flask 和 Waitress,可以通過(guò) pip 安裝它們。pip install flask waitress使用 Waitress 部署 Flask 應(yīng)用假設(shè)你已經(jīng)有了一個(gè)簡(jiǎn)單的 Flask 應(yīng)用,文件名為
大模型完全離線運(yùn)行:所有數(shù)據(jù)處理在本地完成,杜絕隱私泄露風(fēng)險(xiǎn)。RAG(檢索增強(qiáng)生成)知識(shí)庫(kù),用戶(hù)權(quán)限管理:支持多用戶(hù)登錄、角色分配及 SSO 單點(diǎn)登錄,安全又規(guī)范。自動(dòng)保存聊天記錄,支持導(dǎo)出 / 導(dǎo)入,方便回溯。 支持圖片、語(yǔ)音等多模態(tài)輸入,交互更靈活。一、本地部署大模型二、本地
查看CV大模型部署任務(wù)詳情 部署任務(wù)創(chuàng)建成功后,可以查看大模型部署的任務(wù)詳情,具體步驟如下: 登錄ModelArts Studio大模型開(kāi)發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,完成創(chuàng)建CV大模型部署任務(wù)后,可以查看模型的部署狀態(tài)。
在“選擇模型”頁(yè)面,選擇“模型廣場(chǎng) > 向量&重排模型 > 模型”,單擊“確定”進(jìn)入“創(chuàng)建部署”頁(yè)面。 在“創(chuàng)建部署”頁(yè)面,參考表1完成部署參數(shù)設(shè)置。 表1 Pangu-EmbeddingRank-zh模型部署參數(shù)說(shuō)明 參數(shù)分類(lèi) 部署參數(shù) 參數(shù)說(shuō)明 部署配置 選擇模型 可以修改如下信息: 來(lái)源:選擇“模型廣場(chǎng)”。
可以查看模型的部署狀態(tài)。 當(dāng)狀態(tài)顯示為“運(yùn)行中”時(shí),表示模型已成功部署。此過(guò)程可能需要較長(zhǎng)時(shí)間,請(qǐng)耐心等待。 單擊模型名稱(chēng)進(jìn)入詳情頁(yè),查看模型的部署詳情、部署事件、部署日志等信息。 圖2 部署詳情 父主題: 部署科學(xué)計(jì)算大模型
圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,單擊模型名稱(chēng),進(jìn)入模型詳情頁(yè)面。 單擊右上角“模型更新”,進(jìn)入“模型更新”頁(yè)面。 在“可修改配置 > 選擇模型”中,可選擇模型以替換當(dāng)前已部署的模型。 在“升級(jí)配置”中,選擇以下兩種升級(jí)模式: 全量升級(jí):新舊版本服務(wù)同
部署配置 選擇模型 可以修改如下信息: 來(lái)源:選擇“我的資產(chǎn)”。 類(lèi)型:選擇“大語(yǔ)言模型”,并選擇需要進(jìn)行部署的模型和版本。 部署方式 本案例中選擇“云上部署”。 云上部署:算法部署至平臺(tái)提供的資源池中。 邊緣部署:算法部署至客戶(hù)的邊緣設(shè)備中(僅支持邊緣部署的模型可配置邊緣部署)。
管理三方大模型部署任務(wù) 模型更新 完成創(chuàng)建三方大模型部署任務(wù)后,可以替換已部署的模型并升級(jí)配置,具體步驟如下: 登錄ModelArts Studio大模型開(kāi)發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,單擊模型名稱(chēng),進(jìn)入模型詳情頁(yè)面。
引言 隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,模型的跨平臺(tái)移植與部署變得越來(lái)越重要。無(wú)論是將模型從開(kāi)發(fā)環(huán)境移植到生產(chǎn)環(huán)境,還是在不同的硬件平臺(tái)上運(yùn)行,跨平臺(tái)部署都能顯著提高模型的實(shí)用性和可擴(kuò)展性。本文將介紹如何使用Python實(shí)現(xiàn)深度學(xué)習(xí)模型的跨平臺(tái)移植與部署,并提供詳細(xì)的代碼示例。 所需工具
BS服務(wù)。 創(chuàng)建模型:把模型文件和推理文件導(dǎo)入到ModelArts的模型倉(cāng)庫(kù)中,進(jìn)行版本化管理,并構(gòu)建為可運(yùn)行的模型。 部署服務(wù):模型構(gòu)建完成后,根據(jù)您的業(yè)務(wù)場(chǎng)景,選擇將模型部署成對(duì)應(yīng)的服務(wù)類(lèi)型。 將模型部署為實(shí)時(shí)推理作業(yè) 將模型部署為一個(gè)Web Service,并且提供在線的測(cè)
圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,單擊模型名稱(chēng),進(jìn)入模型詳情頁(yè)面。 單擊右上角“模型更新”,進(jìn)入“模型更新”頁(yè)面。 在“可修改配置 > 選擇模型”中,可選擇模型以替換當(dāng)前已部署的模型。 在“升級(jí)配置”中,選擇以下兩種升級(jí)模式: 全量升級(jí):新舊版本服務(wù)同
管理科學(xué)計(jì)算大模型部署任務(wù) 模型更新 完成創(chuàng)建科學(xué)計(jì)算大模型部署任務(wù)后,可以替換已部署的模型并升級(jí)配置,具體步驟如下: 登錄ModelArts Studio大模型開(kāi)發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“模型開(kāi)發(fā) > 模型部署”,單擊模型名稱(chēng),進(jìn)入模型詳情頁(yè)面。
參數(shù)說(shuō)明 部署配置 選擇模型 可以修改如下信息: 來(lái)源:選擇“模型廣場(chǎng)”。 類(lèi)型:選擇“搜索規(guī)劃模型”,并選擇需要進(jìn)行部署的模型和版本。 部署方式 云上部署:算法部署至平臺(tái)提供的資源池中。 資源配置 計(jì)費(fèi)模式 包年包月計(jì)費(fèi)模式。 實(shí)例數(shù) 設(shè)置部署模型時(shí)所需的實(shí)例數(shù)。 訂閱提醒 訂閱提醒
部署預(yù)測(cè)大模型 創(chuàng)建預(yù)測(cè)大模型部署任務(wù) 查看預(yù)測(cè)大模型部署任務(wù)詳情 管理預(yù)測(cè)大模型部署任務(wù) 父主題: 開(kāi)發(fā)盤(pán)古預(yù)測(cè)大模型