五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

[快速入門]中國(guó)ai大模型都有哪些
大模型混合云

全鏈路專業(yè)服務(wù),讓模型從可用到好用 · 6階段30+專業(yè)服務(wù),覆蓋模型建設(shè)全流程,加速政企落地大模型 · 創(chuàng)新運(yùn)營(yíng)服務(wù)模式,實(shí)現(xiàn)全場(chǎng)景模型經(jīng)驗(yàn)沉淀、全流程運(yùn)營(yíng)賦能產(chǎn)業(yè),快速孵化模型場(chǎng)景化應(yīng)用 模型混合云十創(chuàng)新技術(shù) 模型混合云十創(chuàng)新技術(shù) 了解詳情 十創(chuàng)新技術(shù) 加速構(gòu)建企業(yè)專屬大模型

盤(pán)古NLP大模型

體驗(yàn) 政企知識(shí)檢索 智能創(chuàng)意營(yíng)銷 行業(yè)API助手 行業(yè)研發(fā)助手 政企會(huì)議助手 文檔與學(xué)習(xí)成長(zhǎng) 盤(pán)古模型 盤(pán)古模型 什么是盤(pán)古模型 盤(pán)古NLP模型能力與規(guī)格 盤(pán)古模型快速入門 如何調(diào)用盤(pán)古模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū)

盤(pán)古預(yù)測(cè)大模型

文檔與學(xué)習(xí)成長(zhǎng) 盤(pán)古模型 盤(pán)古模型 什么是盤(pán)古模型 盤(pán)古預(yù)測(cè)模型能力與規(guī)格 盤(pán)古模型快速入門 如何調(diào)用盤(pán)古模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū) 優(yōu)質(zhì)昇騰云AI模型專區(qū) 幾行代碼自由部署AI應(yīng)用 豐富多樣的AI訓(xùn)練數(shù)據(jù)集 場(chǎng)景化AI案例,助力AI賦能千行百業(yè)

盤(pán)古大模型 panguLM

盤(pán)古模型 PanguLargeModels 盤(pán)古模型 PanguLargeModels 盤(pán)古模型是面向B端行業(yè)的模型,包含L0中5類基礎(chǔ)模型、L1行業(yè)大模型及L2場(chǎng)景模型三層架構(gòu) 盤(pán)古模型是面向B端行業(yè)的模型,包含L0中5類基礎(chǔ)模型、L1行業(yè)大模型及L2場(chǎng)景模型三層架構(gòu)

大模型安全護(hù)欄 ModelArts Guard

模型安全護(hù)欄 ModelArts Guard 模型安全護(hù)欄 ModelArts Guard 模型安全護(hù)欄(ModelArts Guard),做配套模型的內(nèi)容安全防線 模型安全護(hù)欄(ModelArts Guard),做配套模型的安全防線,開(kāi)放兼容,適用盤(pán)古模型和三方模型

盤(pán)古多模態(tài)大模型

廣汽借助華為云盤(pán)古多模態(tài)模型,打造業(yè)界首個(gè)支持點(diǎn)云生成的模型,為其端到端仿真高效迭代提供強(qiáng)有力支撐。 文檔與學(xué)習(xí)成長(zhǎng) 盤(pán)古模型 盤(pán)古模型 什么是盤(pán)古模型 盤(pán)古多模態(tài)模型能力與規(guī)格 用戶指南 如何調(diào)用盤(pán)古模型API 查看全部 AI Gallery百模千態(tài)社區(qū) AI Gallery百模千態(tài)社區(qū)

盤(pán)古科學(xué)計(jì)算大模型

提供高精度的全球模型,無(wú)需定制和訓(xùn)練,直接訂閱即可推理 多種部署形態(tài) 支持公有云、混合云、邊緣多種形態(tài),滿足不同需求 文檔與學(xué)習(xí)成長(zhǎng) 盤(pán)古模型 盤(pán)古模型 什么是盤(pán)古模型 盤(pán)古科學(xué)計(jì)算模型能力與規(guī)格 盤(pán)古模型用戶指南 如何調(diào)用盤(pán)古模型API 查看全部 AI Gallery百模千態(tài)社區(qū)

華為云Stack

從業(yè)務(wù)上好云到用好云,實(shí)現(xiàn)深度用云 模型混合云 AI可信數(shù)據(jù)空間 智能研發(fā)生產(chǎn)線 工業(yè)互聯(lián)網(wǎng) 專業(yè)服務(wù) 模型混合云 賦能千行萬(wàn)業(yè) 支持盤(pán)古CV、NLP、預(yù)測(cè)、多模態(tài)模型和第三方模型, 提供30+專業(yè)服務(wù)與持續(xù)運(yùn)營(yíng)體系,使能政企一站式建設(shè)專屬模型 使能百模千態(tài) 提供一站式AI模型開(kāi)發(fā)平臺(tái)和工程工具鏈,使能數(shù)據(jù)、模型和應(yīng)用一站式開(kāi)發(fā)

大模型混合云十大場(chǎng)景

模型混合云TOP N 場(chǎng)景 模型混合云TOP N 場(chǎng)景 1對(duì)1咨詢 了解華為云Stack 模型行業(yè)場(chǎng)景落地三要素 模型行業(yè)場(chǎng)景落地三要素 場(chǎng)景是模型行業(yè)落地的關(guān)鍵所在,而在場(chǎng)景落地過(guò)程中,數(shù)據(jù)、經(jīng)驗(yàn)和生態(tài)是核心要素,數(shù)據(jù)的數(shù)量和質(zhì)量決定模型效果上限;經(jīng)驗(yàn)就像“名師指導(dǎo)”

[相關(guān)產(chǎn)品]中國(guó)ai大模型都有哪些
AI大模型 算法備案

《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》明確,具有輿論屬性或者社會(huì)動(dòng)員能力的算法推薦服務(wù)提供者應(yīng)當(dāng)在提供服務(wù)之日起十個(gè)工作日內(nèi)通過(guò)互聯(lián)網(wǎng)信息服務(wù)算法備案系統(tǒng)填報(bào)服務(wù)提供者的名稱、服務(wù)形式、應(yīng)用領(lǐng)域、算法類型、算法自評(píng)估報(bào)告、擬公示內(nèi)容等信息  方便

AI大模型專業(yè)服務(wù)

湘江鯤鵬目前在人工智能模型領(lǐng)域擁有算力、數(shù)據(jù)、算法三關(guān)鍵要素的經(jīng)驗(yàn)積累,構(gòu)建了模型三個(gè)方面的差異化競(jìng)爭(zhēng)力,盤(pán)古模型AI專業(yè)服務(wù)覆蓋從前期咨詢、規(guī)劃設(shè)計(jì),到數(shù)據(jù)工程、模型訓(xùn)練,再到應(yīng)用工程及模型運(yùn)維的完整流程。基于華為盤(pán)古提供的AI專業(yè)服務(wù)包,致力于為企業(yè)提供一站式人工智能解決方案

大模型及AI應(yīng)用配套服務(wù)

angChain等流行的模型開(kāi)發(fā)框架,構(gòu)建企業(yè)級(jí)AI應(yīng)用;團(tuán)隊(duì)擁有成熟的軟件工程技術(shù)和管理能力。6. 模型使用的技術(shù)支持,用戶使用模型平臺(tái),解答用戶使用過(guò)程遇到的問(wèn)題;模型與應(yīng)用對(duì)接集成,以及進(jìn)行日常巡檢、故障處理、模型升級(jí)等服務(wù)。4. 工業(yè)數(shù)據(jù)模型(CAD模型、CAE模

天尊大模型AIGC場(chǎng)景解決方案

太杉天尊模型AIGC場(chǎng)景解決方案是以AI場(chǎng)景解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。具備自研的行業(yè)模型能力,主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。太杉天尊模型AIGC場(chǎng)景解決方案,是一款專為滿足政府企

人工智能AI大模型技術(shù)研發(fā)定制服務(wù)

公司集成了世界領(lǐng)先的底層模型,具備打通跨模型和工具鏈的平臺(tái),提供從需求分析、數(shù)據(jù)收集、模型設(shè)計(jì)、訓(xùn)練優(yōu)化、評(píng)估、系統(tǒng)集成、用戶界面設(shè)計(jì)、部署維護(hù)、合規(guī)性檢查、技術(shù)支持、性能監(jiān)控、擴(kuò)展性設(shè)計(jì)、定制服務(wù)到持續(xù)研發(fā)一站式AI模型定制研發(fā)服務(wù)。光啟慧語(yǔ)是一家圍繞模型全棧開(kāi)展技術(shù)研發(fā)和產(chǎn)

博匠行業(yè)AI大模型專業(yè)服務(wù)

數(shù)據(jù)質(zhì)量。4. 模型訓(xùn)練:?設(shè)計(jì)調(diào)優(yōu)方案,實(shí)施模型訓(xùn)練,并進(jìn)行模型評(píng)測(cè)。?熟悉盤(pán)古模型工作流和云服務(wù)操作,確保模型效果優(yōu)化。5. 應(yīng)用工程:?提供基于模型能力的Agent開(kāi)發(fā)和應(yīng)用對(duì)接服務(wù)。?具備良好的軟件開(kāi)發(fā)和溝通能力,實(shí)現(xiàn)模型與應(yīng)用的無(wú)縫對(duì)接。6. 模型運(yùn)維: ?提供技

盤(pán)古大模型專家服務(wù)

. 模型更新后,將新模型部署至相應(yīng)環(huán)境。 十一、模型評(píng)測(cè)1. 設(shè)計(jì)模型評(píng)測(cè)方案,對(duì)模型各類指標(biāo)進(jìn)行評(píng)測(cè)。2. 能夠按評(píng)測(cè)標(biāo)準(zhǔn)對(duì)模型各項(xiàng)能力進(jìn)行打分,輸出模型評(píng)測(cè)報(bào)告。 十二、Agent開(kāi)發(fā)1. 基于場(chǎng)景,設(shè)計(jì)并開(kāi)發(fā)Agent工具。2. 基于langchain等模型框架,完

天尊大模型AIGC場(chǎng)景解決方案配套服務(wù)

天尊模型AIGC場(chǎng)景解決方案配套服務(wù)是太杉AIGC解決方案的人工服務(wù),是以AI應(yīng)用解決方案為核心的全棧Maas綜合方案,助力政企客戶靈活部署(可公有可私有部署)。主要用于政府/公安/教育等行業(yè)的數(shù)據(jù)處理、文本處理以及多模態(tài)處理等多場(chǎng)景。天尊模型AIGC場(chǎng)景解決方案配套服務(wù)是太

序列猴子大模型

出門問(wèn)問(wèn)模型“序列猴子”是一款具備多模態(tài)生成能力的語(yǔ)言模型模型以語(yǔ)言為核心的能力體系涵蓋“知識(shí)、對(duì)話、數(shù)學(xué)、邏輯、推理、規(guī)劃”六個(gè)維度,能夠同時(shí)支持文字生成、圖片生成、3D內(nèi)容生成、語(yǔ)言生成和語(yǔ)音識(shí)別等不同任務(wù)。出門問(wèn)問(wèn)模型“序列猴子”是一款具備多模態(tài)生成能力的語(yǔ)言模型,模

[相似文章]中國(guó)ai大模型都有哪些
華為云盤(pán)古大模型_華為云AI大模型_盤(pán)古人工智能

華為云盤(pán)古模型 華為云盤(pán)古模型 AI for Industries 模型重塑千行百業(yè) AI for Industries 模型重塑千行百業(yè) 盤(pán)古模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識(shí)know-how與模型能力相結(jié)合

CDN服務(wù)器都有哪些_CDN加速有哪幾種_CDN有哪些

源站資源在節(jié)點(diǎn)上緩存的時(shí)間,方便您根據(jù)業(yè)務(wù)需要對(duì)不同的文件設(shè)置相應(yīng)的緩存過(guò)期時(shí)間。 如何提高緩存命中率 CDN緩存命中率低,會(huì)導(dǎo)致源站壓力,靜態(tài)資源訪問(wèn)效率低。您可以針對(duì)導(dǎo)致CDN緩存命中率低的具體原因,選擇對(duì)應(yīng)的優(yōu)化策略,來(lái)提高CDN的緩存命中率。 CDN加速日志轉(zhuǎn)存到OBS

ModelArts推理部署_模型_AI應(yīng)用來(lái)源-華為云

ModelArts支持本地準(zhǔn)備模型包,編寫(xiě)模型配置文件和模型推理代碼,將準(zhǔn)備好的模型包上傳至對(duì)象存儲(chǔ)服務(wù)OBS,從OBS導(dǎo)入模型創(chuàng)建為AI應(yīng)用。 制作模型包,則需要符合一定的模型包規(guī)范。模型包里面必需包含“model”文件夾,“model”文件夾下面放置模型文件,模型配置文件,模型推理代碼文件。

ERP都有哪些系統(tǒng)_ERP OA_ERP和WMS

件的集中管理,企業(yè)可以實(shí)現(xiàn)對(duì)各個(gè)組織和工廠的統(tǒng)一調(diào)度和協(xié)同工作,提高整體生產(chǎn)效率。 物流全鏈條的數(shù)字化透明化是杰諾家居行業(yè)ERP軟件的又一亮點(diǎn)。通過(guò)軟件的物流管理模塊,企業(yè)可以實(shí)時(shí)掌握物流配送的情況,包括貨物的出庫(kù)、運(yùn)輸、到達(dá)等環(huán)節(jié)。這不僅可以提高物流配送的效率,還可以減少貨物丟失和損壞的風(fēng)險(xiǎn)。

安全云腦-安全大屏_綜合態(tài)勢(shì)大屏_態(tài)勢(shì)大屏有哪些內(nèi)容

安全云腦_綜合態(tài)勢(shì)屏 安全云腦_綜合態(tài)勢(shì)屏 在現(xiàn)場(chǎng)講解匯報(bào)、實(shí)時(shí)監(jiān)控等場(chǎng)景下,為了獲得更好的演示效果,通常需要將安全云腦服務(wù)的分析結(jié)果展示在大型屏幕上。 安全云腦默認(rèn)提供一個(gè)綜合感知態(tài)勢(shì)屏,可以還原攻擊歷史,感知攻擊現(xiàn)狀,預(yù)測(cè)攻擊態(tài)勢(shì),為用戶提供強(qiáng)大的事前、事中、事后安全管理能力,實(shí)現(xiàn)一屏全面感知。

權(quán)限管理-好會(huì)計(jì)中都有哪些角色-好會(huì)計(jì)中如何操作賬套遷移

好會(huì)計(jì):權(quán)限管理 & 賬套遷移 好會(huì)計(jì):權(quán)限管理 & 賬套遷移 好會(huì)計(jì),權(quán)限管理:角色分為管理員、會(huì)計(jì)主管、普通會(huì)計(jì)、出納、老板等角色,每個(gè)角色都有對(duì)應(yīng)的不同權(quán)限。 賬套遷移:企業(yè)在運(yùn)營(yíng)過(guò)程中,難免會(huì)遭遇財(cái)務(wù)軟件無(wú)法滿足需求、合并、轉(zhuǎn)型等情況,此時(shí)進(jìn)行賬套遷移就是必要的選擇。好會(huì)計(jì)的數(shù)

ModelArts模型訓(xùn)練_模型訓(xùn)練簡(jiǎn)介_(kāi)如何訓(xùn)練模型

ModelArts模型訓(xùn)練 ModelArts模型訓(xùn)練簡(jiǎn)介 ModelArts模型訓(xùn)練,俗稱“建模”,指通過(guò)分析手段、方法和技巧對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,為商業(yè)目的提供決策參考。訓(xùn)練模型的結(jié)果通常是一個(gè)或多個(gè)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型模型可以應(yīng)用到新的數(shù)據(jù)中,得到預(yù)測(cè)、評(píng)價(jià)等結(jié)果。

RPA AI_RPA有哪些_RPA核心技術(shù)

SaaS層,用戶可以使用費(fèi)控應(yīng)用、OCR應(yīng)用、人工補(bǔ)錄應(yīng)用、規(guī)則應(yīng)用、智能提單應(yīng)用、數(shù)據(jù)合理合規(guī)審查應(yīng)用、運(yùn)營(yíng)報(bào)表應(yīng)用等功能。 總之,IFS智能財(cái)務(wù)商城是一款功能強(qiáng)大、操作簡(jiǎn)便的財(cái)務(wù)智能化解決方案,能夠幫助中小企業(yè)實(shí)現(xiàn)智能財(cái)務(wù)需求,提升企業(yè)的財(cái)務(wù)管理效率。如果您對(duì)財(cái)務(wù)智能化有需求,不妨考慮一下IFS智能財(cái)務(wù)商城,相信它會(huì)給您帶來(lái)意想不到的驚喜。

OA辦公系統(tǒng)都有哪家_醫(yī)院OA辦公系統(tǒng)

件、相關(guān)系統(tǒng)對(duì)接等功能。 訪問(wèn)店鋪 私有云部署的移動(dòng)安全辦公云平臺(tái) 私有云上的璀璨“明珠”內(nèi)網(wǎng)“微信”。面向高安全訴求群體,專為黨政機(jī)關(guān)及、中型企事業(yè)單位的安全通信需求,自主研發(fā)的即時(shí)通訊+第三方應(yīng)用相結(jié)合的跨終端、安全可信標(biāo)準(zhǔn)化的即時(shí)通訊服務(wù) 訪問(wèn)店鋪 OA協(xié)同辦公平臺(tái) 圍繞

中國(guó)ai大模型都有哪些

AI Gallery支持將模型進(jìn)行微調(diào),訓(xùn)練后得到更優(yōu)模型。

場(chǎng)景描述

模型微調(diào)是深度學(xué)習(xí)中的一種重要技術(shù),它是指在預(yù)訓(xùn)練好的模型基礎(chǔ)上,通過(guò)調(diào)整部分參數(shù),使其在特定任務(wù)上達(dá)到更好的性能。 在實(shí)際應(yīng)用中,預(yù)訓(xùn)練模型是在大規(guī)模通用數(shù)據(jù)集上訓(xùn)練得到的,而在特定任務(wù)上,這些模型的參數(shù)可能并不都是最合適的,因此需要進(jìn)行微調(diào)。

AI Gallery的模型微調(diào),簡(jiǎn)單易用,用戶只需要選擇訓(xùn)練數(shù)據(jù)、創(chuàng)建微調(diào)任務(wù),模型微調(diào)就會(huì)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,快速生成模型。

約束限制

  • 如果模型的“任務(wù)類型”“文本問(wèn)答”“文本生成”,則支持模型微調(diào)。如果模型的“任務(wù)類型”是除“文本問(wèn)答”“文本生成”之外的類型(即自定義模型),則模型文件必須滿足自定義模型規(guī)范(訓(xùn)練)才支持模型自定義訓(xùn)練。
  • 當(dāng)使用自定義 鏡像 進(jìn)行模型微調(diào)時(shí),要確認(rèn)鏡像是否滿足自定義鏡像規(guī)范,否則無(wú)法成功完成自定義訓(xùn)練。

進(jìn)入模型微調(diào)

  1. 登錄AI Gallery。
  2. 單擊“模型”進(jìn)入模型列表。
  3. 選擇需要進(jìn)行微調(diào)訓(xùn)練的模型,單擊模型名稱進(jìn)入模型詳情頁(yè)。
  4. 在模型詳情頁(yè),選擇“訓(xùn)練 > 微調(diào)大師”進(jìn)入微調(diào)工作流頁(yè)面。

選擇訓(xùn)練任務(wù)類型

選擇模型微調(diào)的訓(xùn)練任務(wù)類型。

  • 當(dāng)模型的“任務(wù)類型”“文本問(wèn)答”“文本生成”時(shí),“訓(xùn)練任務(wù)類型”默認(rèn)和模型“任務(wù)類型”一致。“訓(xùn)練任務(wù)類型”支持修改,如果模型文件滿足自定義模型規(guī)范(訓(xùn)練),則“訓(xùn)練任務(wù)類型”支持選擇“自定義”。
  • 當(dāng)模型的“任務(wù)類型”是除“文本問(wèn)答”“文本生成”之外的類型(即自定義模型)時(shí),則“訓(xùn)練任務(wù)類型”默認(rèn)為“自定義”,支持修改為“文本問(wèn)答”“文本生成”。
  • 當(dāng)使用自定義鏡像進(jìn)行模型微調(diào)時(shí),“訓(xùn)練任務(wù)類型”默認(rèn)為“自定義”,且不支持修改。

準(zhǔn)備數(shù)據(jù)

  • 本地上傳數(shù)據(jù)需要確保數(shù)據(jù)已按照數(shù)據(jù)集要求完成編排。如果是自定義模型,此處的數(shù)據(jù)集要求即為模型文件“dataset_readme.md”里的內(nèi)容。
  • 單個(gè)文件最大5GB,所有文件總大小不超過(guò)50G。
  1. 在微調(diào)工作流的“數(shù)據(jù)準(zhǔn)備”環(huán)節(jié)選擇數(shù)據(jù)集。
    • 從本地上傳
      1. “從本地上傳”處,單擊“點(diǎn)擊上傳”,選擇本地編排好的訓(xùn)練數(shù)據(jù)。
      2. 數(shù)據(jù)上傳成功后,頁(yè)面會(huì)有提示信息。

        此時(shí)AI Gallery會(huì)自動(dòng)新建一個(gè)數(shù)據(jù)集,單擊提示信息處的“查看”可以進(jìn)入數(shù)據(jù)集詳情頁(yè),也可以在“我的Gallery > 數(shù)據(jù)集 > 我創(chuàng)建的數(shù)據(jù)集”進(jìn)入數(shù)據(jù)集詳情頁(yè)查看。

    • 從AI Gallery中選
      1. 單擊“從AI Gallery中選擇”。
      2. 在彈窗中,從“我創(chuàng)建的”或“我收藏的”數(shù)據(jù)集中選擇所需要數(shù)據(jù)集。
      3. 選擇完成后,單擊“確定”。
  2. 數(shù)據(jù)準(zhǔn)備完成后,單擊“下一步”進(jìn)入“作業(yè)設(shè)置”環(huán)節(jié)。

設(shè)置并啟動(dòng)作業(yè)

  1. 在微調(diào)工作流的“作業(yè)設(shè)置”環(huán)節(jié)配置訓(xùn)練作業(yè)參數(shù)。
    1. 算法配置,會(huì)顯示已選模型的信息,基于已選模型選擇微調(diào)方式。
      • 當(dāng)“訓(xùn)練任務(wù)類型”“文本問(wèn)答”“文本生成”時(shí),AI Gallery支持的微調(diào)方式是LoRA。
      • 當(dāng)“訓(xùn)練任務(wù)類型”“自定義”時(shí),微調(diào)方式來(lái)自于模型文件“train_params.json” 。

      低秩適應(yīng)(LoRA)是一種重參數(shù)化方法,旨在減少具有低秩表示的可訓(xùn)練參數(shù)的數(shù)量。權(quán)重矩陣被分解為經(jīng)過(guò)訓(xùn)練和更新的低秩矩陣。所有預(yù)訓(xùn)練的模型參數(shù)保持凍結(jié)。訓(xùn)練后,低秩矩陣被添加回原始權(quán)重。這使得存儲(chǔ)和訓(xùn)練LoRA模型更加高效,因?yàn)閰?shù)明顯減少。

    2. 超參數(shù)設(shè)置,基于訓(xùn)練作業(yè)配置超參。超參指的是模型訓(xùn)練時(shí)原始數(shù)據(jù)集中實(shí)際字段和算法需要字段之間的映射關(guān)系。
      • 當(dāng)“訓(xùn)練任務(wù)類型”“文本問(wèn)答”“文本生成”時(shí),則常見(jiàn)的超參說(shuō)明請(qǐng)參見(jiàn)表1。
      • 當(dāng)“訓(xùn)練任務(wù)類型”“自定義”時(shí),超參信息來(lái)自于模型文件“train_params.json” 。如果不使用可選超參,建議單擊右側(cè)的刪除按鈕,刪除參數(shù)。
      表1 常見(jiàn)超參說(shuō)明

      參數(shù)名稱

      參數(shù)類型

      說(shuō)明

      data_url

      String

      數(shù)據(jù) OBS 存儲(chǔ)路徑。

      train_url

      String

      微調(diào)產(chǎn)物輸出OBS路徑。

      train_data_file

      String

      訓(xùn)練數(shù)據(jù)文件名。

      test_data_file

      String

      測(cè)試數(shù)據(jù)文件名。

      prompt_field

      String

      數(shù)據(jù)prompt列名。

      response_field

      String

      數(shù)據(jù)response列名。

      history_field

      String

      數(shù)據(jù)history列名。

      prefix

      String

      數(shù)據(jù)格式化時(shí)使用的前綴。

      instruction_template

      String

      數(shù)據(jù)格式化時(shí)使用的指令模板。

      response_template

      String

      數(shù)據(jù)格式化時(shí)使用的回答模板。

      lora_alpha

      int

      Lora scaling的alpha參數(shù)。

      lora_dropout

      float

      Lora dropout概率。

      lora_rank

      int

      Lora attention維度。

      per_device_train_batch_size

      int

      用于訓(xùn)練的每個(gè)GPU/TPU core/CPU的批處理大小。

      gradient_accumulation_steps

      int

      梯度累計(jì)步數(shù)。

      max_steps

      int

      訓(xùn)練最大步數(shù),如果數(shù)據(jù)耗盡,訓(xùn)練將會(huì)在最大步數(shù)前停止。

      save_steps

      int

      checkpoint保存步數(shù)。

      logging_steps

      int

      日志輸出步數(shù)。

      learning_rate

      float

      初始學(xué)習(xí)率。

      max_grad_norm

      float

      梯度裁剪最大范數(shù)。

      warmup_ratio

      float

      熱身步數(shù)比。

      max_seq_length

      int

      數(shù)據(jù)最大序列長(zhǎng)度。

      finetuned_model

      String

      前序微調(diào)產(chǎn)物OBS路徑。

      bits

      int

      模型量化bit數(shù),如4、8。

      max_eval_samples

      int

      最大測(cè)試數(shù)據(jù)數(shù)。

    3. 計(jì)算規(guī)格選擇,按需選擇計(jì)算規(guī)格。單擊“選擇”,在彈窗中選擇資源規(guī)格,單擊“確定”。
      • “所在區(qū)”選擇計(jì)算規(guī)格所在的區(qū)域。默認(rèn)顯示全部區(qū)域的計(jì)算規(guī)格。
      • 選擇計(jì)算規(guī)格不可用的資源會(huì)置灰。右側(cè)“配置信息”區(qū)域會(huì)顯示計(jì)算規(guī)格的詳細(xì)數(shù)據(jù),AI Gallery會(huì)基于資產(chǎn)和資源情況分析該任務(wù)是否支持設(shè)置“商品數(shù)量”,用戶可以基于業(yè)務(wù)需要選擇任務(wù)所需的資源卡數(shù)。

      如果選擇付費(fèi)資源,則請(qǐng)確認(rèn)賬號(hào)未欠費(fèi),且余額高于所選計(jì)算規(guī)格的收費(fèi)標(biāo)準(zhǔn),否則可能會(huì)導(dǎo)致AI Gallery工具鏈服務(wù)異常中斷。AI Gallery的計(jì)算規(guī)格的計(jì)費(fèi)說(shuō)明請(qǐng)參見(jiàn)計(jì)算規(guī)格說(shuō)明。

  2. 作業(yè)參數(shù)配置完成后,單擊“啟動(dòng)作業(yè)”。
  3. “訂單信息確認(rèn)”頁(yè)面,確認(rèn)服務(wù)信息和費(fèi)用,單擊“確定”提交模型訓(xùn)練任務(wù)。

    單擊“返回模型訓(xùn)練”跳轉(zhuǎn)到微調(diào)大師頁(yè)面,可以查看訓(xùn)練作業(yè)狀態(tài)。當(dāng)“狀態(tài)”“訓(xùn)練完成”時(shí),表示微調(diào)任務(wù)完成。

    • 單擊操作列的“查看模型”跳轉(zhuǎn)到微調(diào)獲得的新模型的詳情頁(yè)面。
    • 單擊操作列的“任務(wù)詳情”可以在彈窗中查看“訓(xùn)練信息”、“訓(xùn)練日志”“指標(biāo)效果”。
    • 單擊操作列的“更多 > 刪除任務(wù)”,可以刪除微調(diào)任務(wù),但是微調(diào)獲得的新模型不會(huì)被刪除。

查看訓(xùn)練效果

啟動(dòng)模型微調(diào)任務(wù)后,在微調(diào)大師列表單擊操作列的“任務(wù)詳情”,在彈窗中選擇“指標(biāo)效果”頁(yè)簽,可以查看訓(xùn)練效果。

表2 訓(xùn)練效果的指標(biāo)介紹

指標(biāo)名稱

指標(biāo)說(shuō)明

NPU/GPU利用率

在訓(xùn)練過(guò)程中,機(jī)器的NPU/GPU占用情況(橫坐標(biāo)時(shí)間,縱坐標(biāo)占用率)。

顯存利用率

在訓(xùn)練過(guò)程中,機(jī)器的顯存占用情況(橫坐標(biāo)時(shí)間,縱坐標(biāo)占用率)。

吞吐

在訓(xùn)練過(guò)程中,每卡處理tokens數(shù)量(tokens/s/p)。每種框架計(jì)算方式不一致,例如,ATB可通過(guò)“samples per second*seq_lenth/總卡數(shù)”得到tokens/s/p,輸出給throughout字段,seq_lenth取值在訓(xùn)練腳本中可以查看。

單機(jī)8卡吞吐量一般為1650tokens/s/p,雙機(jī)16卡吞吐量一般為1625tokens/s/p。

說(shuō)明:

自定義訓(xùn)練或自定義鏡像訓(xùn)練,需要提前在訓(xùn)練啟動(dòng)腳本(例如“train.py”)中定義好迭代次數(shù)、LOSS和吞吐數(shù)據(jù)的存放位置,以及存放格式(必須是“迭代次數(shù)|loss|吞吐”),才能在此處正常查看吞吐和“訓(xùn)練LOSS”曲線。

訓(xùn)練LOSS

訓(xùn)練階段的LOSS變化,模型在日志里用LOSS關(guān)鍵詞記錄數(shù)據(jù),按照訓(xùn)練迭代周期記錄LOSS值。

微調(diào)產(chǎn)物說(shuō)明

模型微調(diào)完成后,會(huì)得到一個(gè)新模型,即微調(diào)產(chǎn)物。

在微調(diào)大師頁(yè)面,單擊操作列的“查看模型”跳轉(zhuǎn)到微調(diào)獲得的新模型的詳情頁(yè)面。選擇“模型文件”頁(yè)簽可以查看微調(diào)產(chǎn)物。各文件說(shuō)明請(qǐng)參見(jiàn)表3。

圖1 微調(diào)產(chǎn)物示例
表3 微調(diào)產(chǎn)物說(shuō)明

文件名

文件說(shuō)明

gallery_train文件夾

自定義模型的模型訓(xùn)練文件,僅當(dāng)使用自定義模型微調(diào)時(shí)才會(huì)有這個(gè)微調(diào)產(chǎn)物,內(nèi)容和預(yù)訓(xùn)練模型里的gallery_train文件一致。

training_logs/user_params.json

微調(diào)配置參數(shù)信息,AI Gallery會(huì)自動(dòng)將微調(diào)設(shè)置的參數(shù)信息記錄在此文件下。

“README.md”

模型的基礎(chǔ)信息。內(nèi)容和預(yù)訓(xùn)練模型里“模型文件”頁(yè)簽的“README.md”一致。

其他文件

當(dāng)使用自定義模型微調(diào)時(shí),可能還會(huì)有一些其他微調(diào)產(chǎn)物,這是由自定義模型的訓(xùn)練腳本文件train.py決定的,如果訓(xùn)練腳本定義了歸檔其他訓(xùn)練產(chǎn)物,就會(huì)在此處呈現(xiàn)。

中國(guó)ai大模型都有哪些常見(jiàn)問(wèn)題

更多常見(jiàn)問(wèn)題 >>
  • 盤(pán)古大模型致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集,將行業(yè)知識(shí)know-how與大模型能力相結(jié)合,重塑千行百業(yè),成為各組織、企業(yè)、個(gè)人的專家助手。

  • 模型轉(zhuǎn)換,即將開(kāi)源框架的網(wǎng)絡(luò)模型(如Caffe、TensorFlow等),通過(guò)ATC(Ascend Tensor Compiler)模型轉(zhuǎn)換工具,將其轉(zhuǎn)換成昇騰AI處理器支持的離線模型。

  • 本次Serverless應(yīng)用中心上線文生圖應(yīng)用,用戶無(wú)需下載源代碼、了解各種安裝部署知識(shí)、安裝復(fù)雜的依賴,通過(guò)華為云Serverless應(yīng)用中心即可一鍵創(chuàng)建AI文生圖應(yīng)用,體驗(yàn) “0” 構(gòu)建門檻、“0” 資源閑置并具備極致彈性的Serverless AI繪圖能力。

  • 在自然語(yǔ)言處理(NLP)領(lǐng)域中,使用語(yǔ)言模型預(yù)訓(xùn)練方法在多項(xiàng)NLP任務(wù)上都獲得了不錯(cuò)的提升,廣泛受到了各界的關(guān)注。本課程將簡(jiǎn)單介紹一下預(yù)訓(xùn)練的思想,幾個(gè)代表性模型和它們之間的關(guān)系。

  • 華為云Serverless技術(shù)極大的優(yōu)化了AI應(yīng)用開(kāi)發(fā)過(guò)程,一鍵部署AI應(yīng)用、提升開(kāi)發(fā)團(tuán)隊(duì)工作效率。讓AI團(tuán)隊(duì)可以更關(guān)注業(yè)務(wù)實(shí)現(xiàn),而無(wú)需關(guān)注底層技術(shù)細(xì)節(jié)。

  • 云專線常見(jiàn)問(wèn)題匯總解答。

更多相關(guān)專題