超參搜索簡(jiǎn)介

ModelArts新版訓(xùn)練中新增了超參搜索功能，自動(dòng)實(shí)現(xiàn)模型超參搜索，為您的模型匹配最優(yōu)的超參。

在模型訓(xùn)練過(guò)程中，有很多超參需要根據(jù)任務(wù)進(jìn)行調(diào)整，比如learning_rate、weight_decay等等，這一工作往往需要一個(gè)有經(jīng)驗(yàn)的算法工程師花費(fèi)一定精力和大量時(shí)間進(jìn)行手動(dòng)調(diào)優(yōu)。ModelArts支持的超參搜索功能，在無(wú)需算法工程師介入的情況下，即可自動(dòng)進(jìn)行超參的調(diào)優(yōu)，在速度和精度上超過(guò)人工調(diào)優(yōu)。

ModelArts支持以下三種超參搜索算法：

1、貝葉斯優(yōu)化(SMAC)

2、TPE算法

3、模擬退火算法(Anneal)

貝葉斯優(yōu)化(SMAC)

貝葉斯優(yōu)化假設(shè)超參和目標(biāo)函數(shù)存在一個(gè)函數(shù)關(guān)系?；谝阉阉鞒瑓⒌脑u(píng)估值，通過(guò)高斯過(guò)程回歸來(lái)估計(jì)其他搜索點(diǎn)處目標(biāo)函數(shù)值的均值和方差。根據(jù)均值和方差構(gòu)造采集函數(shù)（Acquisition Function），下一個(gè)搜索點(diǎn)為采集函數(shù)的極大值點(diǎn)。相比網(wǎng)格搜索，貝葉斯優(yōu)化會(huì)利用之前的評(píng)估結(jié)果，從而降低迭代次數(shù)、縮短搜索時(shí)間；缺點(diǎn)是不容易找到全局最優(yōu)解。

參數(shù)	說(shuō)明	取值參考
num_samples	搜索嘗試的超參組數(shù)	int，一般在10-20之間，值越大，搜索時(shí)間越長(zhǎng)，效果越好
kind	采集函數(shù)類型	string，默認(rèn)為'ucb'，可能取值還有'ei'、'poi'，一般不建議用戶修改
kappa	采集函數(shù)ucb的調(diào)節(jié)參數(shù)，可理解為上置信邊界	float，一般不建議用戶修改
xi	采集函數(shù)poi和ei的調(diào)節(jié)參數(shù)	float，一般不建議用戶修改

TPE算法

TPE算法全稱Tree-structured Parzen Estimator，是一種利用高斯混合模型來(lái)學(xué)習(xí)超參模型的算法。在每次試驗(yàn)中，對(duì)于每個(gè)超參，TPE為與最佳目標(biāo)值相關(guān)的超參維護(hù)一個(gè)高斯混合模型l(x)，為剩余的超參維護(hù)另一個(gè)高斯混合模型g(x)，選擇l(x)/g(x)最大化時(shí)對(duì)應(yīng)的超參作為下一組搜索值。

參數(shù)	說(shuō)明	取值參考
num_samples	搜索嘗試的超參組數(shù)	int，一般在10-20之間，值越大，搜索時(shí)間越長(zhǎng)，效果越好
n_initial_points	采用TPE接近目標(biāo)函數(shù)之前，對(duì)目標(biāo)函數(shù)的隨機(jī)評(píng)估數(shù)	int，一般不建議用戶修改
gamma	TPE算法的一定分位數(shù)，用于劃分l(x)和g(x)	float，范圍(0,1)，一般不建議用戶修改

模擬退火算法(Anneal)

模擬退火算法即Anneal算法，是隨機(jī)搜索中一個(gè)簡(jiǎn)單但有效的變體，它利用了響應(yīng)曲面中的平滑度。退火速率不自適應(yīng)。Anneal算法從先前采樣的一個(gè)試驗(yàn)點(diǎn)作為起點(diǎn)，然后從與先驗(yàn)分布相似的分布中采樣每組超參數(shù)，但其密度更集中在我們選擇的試驗(yàn)點(diǎn)周?chē)ｋS著時(shí)間推移，算法會(huì)傾向于從越來(lái)越接近最佳點(diǎn)處采樣。在采樣過(guò)程中，算法可能繪制一個(gè)次佳試驗(yàn)作為最佳試驗(yàn)，以一定概率跳出局部最優(yōu)解。

參數(shù)	說(shuō)明	取值參考
num_samples	搜索嘗試的超參組數(shù)	int，一般在10-20之間，值越大，搜索時(shí)間越長(zhǎng)，效果越好
avg_best_idx	要探索試驗(yàn)的幾何分布平均，從按照分?jǐn)?shù)排序的試驗(yàn)中選擇	float，一般不建議用戶修改
shrink_coef	隨著更多的點(diǎn)被探索，鄰域采樣大小的減少率	float，一般不建議用戶修改

創(chuàng)建超參搜索作業(yè)

背景信息

對(duì)于用戶希望優(yōu)化的超參，需在“超參”設(shè)置中定義，可以給定名稱、類型、默認(rèn)值、約束等，具體設(shè)置方法可以參考定義超參。

如果用戶使用的AI引擎為pytorch_1.8.0-cuda_10.2-py_3.7-ubuntu_18.04-x86_64和tensorflow_2.1.0-cuda_10.1-py_3.7-ubuntu_18.04-x86_64，并且優(yōu)化的超參類型為float類型，ModelArts支持用戶使用超參搜索功能。

在0代碼修改的基礎(chǔ)下，實(shí)現(xiàn)算法模型的超參搜索。需要完成以下步驟：

準(zhǔn)備工作

1、數(shù)據(jù)已完成準(zhǔn)備：已在ModelArts中創(chuàng)建可用的數(shù)據(jù)集，或者您已將用于訓(xùn)練的數(shù)據(jù)集上傳至OBS目錄。

2、請(qǐng)準(zhǔn)備好訓(xùn)練腳本，并上傳至OBS目錄。訓(xùn)練腳本開(kāi)發(fā)指導(dǎo)參見(jiàn)開(kāi)發(fā)自定義腳本。

3、在訓(xùn)練代碼中，用戶需打印搜索指標(biāo)參數(shù)。

4、已在OBS創(chuàng)建至少1個(gè)空的文件夾，用于存儲(chǔ)訓(xùn)練輸出的內(nèi)容。

5、由于訓(xùn)練作業(yè)運(yùn)行需消耗資源，確保賬戶未欠費(fèi)。

6、確保您使用的OBS目錄與ModelArts在同一區(qū)域。

創(chuàng)建算法

進(jìn)入ModelArts控制臺(tái)，參考創(chuàng)建算法操作指導(dǎo)，創(chuàng)建自定義算法。在配置自定義算法參數(shù)時(shí)，需關(guān)注“超參”和“支持的策略”參數(shù)的設(shè)置。

對(duì)于用戶希望優(yōu)化的超參，需在“超參”設(shè)置中定義，可以給定名稱、類型、默認(rèn)值、約束等。

單擊勾選自動(dòng)搜索，用戶為算法設(shè)置算法搜索功能。自動(dòng)搜索作業(yè)運(yùn)行過(guò)程中，ModelArts后臺(tái)通過(guò)指標(biāo)正則表達(dá)式獲取搜索指標(biāo)參數(shù)，朝指定的優(yōu)化方向進(jìn)行超參優(yōu)化。用戶需要在代碼中打印搜索參數(shù)并在控制臺(tái)配置參數(shù)，具體可參見(jiàn)創(chuàng)建算法。

創(chuàng)建訓(xùn)練作業(yè)（New）

登錄ModelArts控制臺(tái)，參考創(chuàng)建訓(xùn)練作業(yè)操作指導(dǎo)，創(chuàng)建訓(xùn)練作業(yè)。用戶需關(guān)注以下操作才能開(kāi)啟超參搜索。

當(dāng)您選擇支持超參搜索的算法，需單擊超級(jí)參數(shù)的范圍設(shè)置按鈕才能開(kāi)啟超參搜索功能。

開(kāi)啟超參搜索功能后，用戶可以設(shè)置搜索指標(biāo)、搜索算法和搜索算法參數(shù)。三個(gè)參數(shù)顯示的支持值與算法管理模塊的超參設(shè)置一一對(duì)應(yīng)。

完成超參搜索作業(yè)的創(chuàng)建后，訓(xùn)練作業(yè)需要運(yùn)行一段時(shí)間。

創(chuàng)建訓(xùn)練作業(yè)常見(jiàn)問(wèn)題

TPE算法優(yōu)化的超參數(shù)必須是分類特征（categorical features）么？

對(duì)于優(yōu)化的超參數(shù)類型，TPE算法本身是沒(méi)有限制的，但出于面對(duì)普通用戶節(jié)省資源的目的，ModelArts在前端限制了TPE的超參數(shù)必須是float，如果想離散型和連續(xù)型參數(shù)混用的話，可以調(diào)用rest接口。
訓(xùn)練作業(yè)參數(shù)填寫(xiě)應(yīng)該注意什么？

訓(xùn)練作業(yè)參數(shù)填寫(xiě)需要您注意以下幾點(diǎn)：
1、如果已配置算法來(lái)源和數(shù)據(jù)來(lái)源，則下方的運(yùn)行參數(shù)，將根據(jù)選擇的對(duì)象自動(dòng)填寫(xiě)“data_url”，無(wú)法直接在運(yùn)行參數(shù)中直接修改。
2、在創(chuàng)建訓(xùn)練作業(yè)配置運(yùn)行參數(shù)時(shí)，只需要填寫(xiě)對(duì)應(yīng)的參數(shù)與參數(shù)值。
3、訓(xùn)練作業(yè)中的參數(shù)值為OBS桶路徑時(shí)，需要使用數(shù)據(jù)對(duì)應(yīng)的路徑，且以“obs://”開(kāi)頭。
4、在代碼中創(chuàng)建OBS文件夾時(shí)，需要調(diào)用MoXing的API，具體方法如下：
import moxing as mox
mox.file.make_dirs('obs://bucket_name/sub_dir_0/sub_dir_1')
訓(xùn)練作業(yè)的“/cache”目錄是否安全？

ModelArts訓(xùn)練作業(yè)的程序運(yùn)行在容器中，容器掛載的目錄地址是唯一的，只有運(yùn)行時(shí)的容器能訪問(wèn)到。因此訓(xùn)練作業(yè)的“/cache”是安全的。
訓(xùn)練環(huán)境中不同規(guī)格資源“/cache”目錄的大小

在創(chuàng)建訓(xùn)練作業(yè)時(shí)可以根據(jù)訓(xùn)練作業(yè)的大小選擇CPU、GPU或者Ascend資源。
ModelArts會(huì)掛載硬盤(pán)至“/cache”目錄，用戶可以使用此目錄來(lái)儲(chǔ)存臨時(shí)文件。“/cache”與代碼目錄共用資源，不同資源規(guī)格有不同的容量。
訓(xùn)練作業(yè)一直在等待中（排隊(duì)）？
訓(xùn)練作業(yè)狀態(tài)一直在等待中狀態(tài)表示當(dāng)前所選的資源池規(guī)格資源緊張，作業(yè)需要進(jìn)行排隊(duì)，請(qǐng)耐心等待。如想降低排隊(duì)時(shí)間，根據(jù)您所選資源池的類型，有以下建議：
1、公共資源池：
1. 公共資源池資源較少，高峰期如舉辦相關(guān)活動(dòng)時(shí)會(huì)存在資源不足情況。有以下方法可以嘗試：
2. 如果使用的是免費(fèi)規(guī)格，可以換成收費(fèi)規(guī)格，免費(fèi)規(guī)格資源較少，排隊(duì)概率高。
3. 規(guī)格選擇卡數(shù)盡量少，如可以選擇1卡，相比于選擇8卡排隊(duì)幾率大大降低。
4. 可以嘗試使用其他Region（如北京四切換為上海一）。
5. 如果有長(zhǎng)期的資源使用訴求，可以購(gòu)買(mǎi)獨(dú)占使用的專屬資源池。
2、專屬資源池：
1. 如有多個(gè)可用的專屬資源池，可嘗試選擇其他較為空閑的資源池。
2. 可清理當(dāng)前資源池下的其他資源，如停止長(zhǎng)時(shí)間不使用的Notebook。
3. 在非高峰期時(shí)提交訓(xùn)練作業(yè)。
4. 如長(zhǎng)期長(zhǎng)時(shí)間排隊(duì)可以聯(lián)系該專屬資源池的賬號(hào)管理員，管理員可根據(jù)使用情況對(duì)資源池進(jìn)行擴(kuò)容。

ModelArts-產(chǎn)品相關(guān)介紹

更快的普惠AI平臺(tái)

ModelArts相關(guān)精選推薦

查看更多收起

五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

ModelArts訓(xùn)練之超參搜索

ModelArts訓(xùn)練之超參搜索

超參搜索簡(jiǎn)介

貝葉斯優(yōu)化(SMAC)

TPE算法

模擬退火算法(Anneal)

創(chuàng)建超參搜索作業(yè)

背景信息

準(zhǔn)備工作

創(chuàng)建算法

創(chuàng)建訓(xùn)練作業(yè)（New）

創(chuàng)建訓(xùn)練作業(yè)常見(jiàn)問(wèn)題

創(chuàng)建訓(xùn)練作業(yè)常見(jiàn)問(wèn)題

ModelArts-產(chǎn)品相關(guān)介紹

ModelArts相關(guān)精選推薦

五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

ModelArts訓(xùn)練之超參搜索

ModelArts訓(xùn)練之超參搜索

超參搜索簡(jiǎn)介

貝葉斯優(yōu)化(SMAC)

TPE算法

模擬退火算法(Anneal)

創(chuàng)建超參搜索作業(yè)

背景信息

準(zhǔn)備工作

創(chuàng)建算法

創(chuàng)建訓(xùn)練作業(yè)（New）

創(chuàng)建訓(xùn)練作業(yè)常見(jiàn)問(wèn)題

創(chuàng)建訓(xùn)練作業(yè)常見(jiàn)問(wèn)題

ModelArts-產(chǎn)品相關(guān)介紹

ModelArts產(chǎn)品文檔

ModelArts華為云論壇

產(chǎn)品術(shù)語(yǔ)

ModelArts相關(guān)精選推薦