檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
以下內(nèi)容轉(zhuǎn)自: 訓(xùn)練集、驗證集和測試集的意義-JobPlus 在有監(jiān)督的機器學(xué)習(xí)中,經(jīng)常會說到訓(xùn)練集(train)、驗證集(validation)和測試集(test),這三個集合的區(qū)分可能會讓人糊涂,特別是,有些讀者搞不清楚驗證集和測試集有什么區(qū)別。 1 劃分
我們考慮一個具有單個隱藏層的非常簡單的多層感知機。為了訓(xùn)練這個模型,我們將使用小批量隨機梯度下降算法。反向傳播算法用于計算單個小批量上的代價的梯度。具體來說,我們使用訓(xùn)練集上的一小批量實例,將其規(guī)范化為一個設(shè)計矩陣 X 以及相關(guān)聯(lián)的類標簽向量 y。網(wǎng)絡(luò)計算隱藏特征層 H = max{0
管理訓(xùn)練實驗 訓(xùn)練實驗 當(dāng)訓(xùn)練作業(yè)的數(shù)量較多時,可能會遇到難以快速定位作業(yè)或不便跟蹤的情況。為了便于管理訓(xùn)練作業(yè),我們引入了訓(xùn)練實驗的概念,類似于對訓(xùn)練作業(yè)進行分組管理。用戶可以根據(jù)需求將作業(yè)歸類到不同的訓(xùn)練實驗中,實現(xiàn)分類管理。每個訓(xùn)練實驗可以包含多個同類型的作業(yè)。 在管理訓(xùn)練實
訓(xùn)練算法 添加自定義算法 添加算法流程為“初始化訓(xùn)練算法 > 選擇訓(xùn)練算法文件 > 上傳訓(xùn)練算法文件”。具體操作步驟如下: 在左側(cè)菜單欄中選擇“訓(xùn)練服務(wù) > 算法管理”。 單擊“新建訓(xùn)練算法”,填寫算法的名稱和描述信息,其他參數(shù)參考如下。 表1 新建訓(xùn)練算法 參數(shù) 說明 鏡像 選擇使用的鏡像和版本,選定后不支持修改。
將訓(xùn)練腳本打包成zip文件,上傳到3中指定的obs_path中; 如果訓(xùn)練數(shù)據(jù)保存在Notebook中,則將其打包成zip文件并上傳到指定的obs_path中; 將訓(xùn)練作業(yè)提交到ModelArts訓(xùn)練服務(wù)中,訓(xùn)練作業(yè)會使用當(dāng)前Notebook的鏡像來執(zhí)行訓(xùn)練作業(yè); 訓(xùn)練任務(wù)得到的輸出上傳到4指定的obs_pa
準備工作 參考benchmark-準備工作,開始訓(xùn)練測試,具體步驟參考訓(xùn)練性能測試或訓(xùn)練精度測試,根據(jù)實際情況決定。 父主題: 訓(xùn)練評測
可能是模型訓(xùn)練輪數(shù)過多,產(chǎn)生過擬合現(xiàn)象,應(yīng)減少訓(xùn)練輪次。通常來說預(yù)訓(xùn)練的訓(xùn)練輪次在1-2之間即可,不需要訓(xùn)練太多輪次。 模型loss遲遲不下降,或隱約有上升的趨勢。 可能是學(xué)習(xí)率設(shè)置的過大,導(dǎo)致模型在訓(xùn)練初期就已經(jīng)偏離最優(yōu)路線,難以學(xué)到最優(yōu)點。建議減小學(xué)習(xí)率重新訓(xùn)練。 訓(xùn)練初期loss波動較大,grad
訓(xùn)練服務(wù)簡介 訓(xùn)練服務(wù)模塊上承接數(shù)據(jù)服務(wù)和標注服務(wù)兩大模塊,為自動駕駛研發(fā)提供方便易用的模型訓(xùn)練和評測平臺,讓用戶無需過多關(guān)注底層資源,聚焦算法和模型開發(fā)。用戶可上傳符合Octopus平臺規(guī)范的訓(xùn)練算法,使用成熟的算法創(chuàng)建訓(xùn)練任務(wù)生成訓(xùn)練模型。此外,訓(xùn)練服務(wù)提供多種模型評測指標,
單擊“提交”,在“信息確認”頁面,確認訓(xùn)練作業(yè)的參數(shù)信息,確認無誤后單擊“確定”。 訓(xùn)練作業(yè)創(chuàng)建完成后,后臺將自動完成容器鏡像下載、代碼目錄下載、執(zhí)行啟動命令等動作。 訓(xùn)練作業(yè)一般需要運行一段時間,根據(jù)您的訓(xùn)練業(yè)務(wù)邏輯和選擇的資源不同,訓(xùn)練時長將持續(xù)幾十分鐘到幾小時不等。訓(xùn)練作業(yè)執(zhí)行成功后,日志信息如下所示。
不足,并且會延長每次訓(xùn)練的時長。 學(xué)習(xí)率衰減比率 本案例中設(shè)置為0.1。 學(xué)習(xí)率衰減后的比率,用于控制訓(xùn)練過程中學(xué)習(xí)率的下降幅度。經(jīng)過衰減后,學(xué)習(xí)率的最低值由初始學(xué)習(xí)率和衰減比率決定。其計算公式為:最低學(xué)習(xí)率 = 初始學(xué)習(xí)率 * 學(xué)習(xí)率衰減比率。也就是說,學(xué)習(xí)率在每次衰減后不會低于這個計算出來的最低值。
pb”,請勾選預(yù)訓(xùn)練模型。 確認信息后,單擊“開始訓(xùn)練”。 圖1 模型訓(xùn)練 模型訓(xùn)練一般需要運行一段時間,等模型訓(xùn)練完成后,“應(yīng)用開發(fā)>模型訓(xùn)練”頁面下方顯示訓(xùn)練詳情。 查看訓(xùn)練詳情 模型訓(xùn)練完成后,可在“應(yīng)用開發(fā)>模型訓(xùn)練”頁面查看“訓(xùn)練詳情”。 圖2 訓(xùn)練詳情 父主題: HiLens安全帽檢測技能
所有數(shù)據(jù)集選取計算量很大,因此在每個batch中選取。通過triplet loss學(xué)習(xí),使得錨點離負類遠,離正類近。triplet loss的好處是類內(nèi)距離變小,類間距離拉大。配合交叉熵的有監(jiān)督學(xué)習(xí),保留原始標簽信息。 (4)通常在一定長度內(nèi),句子越長情感識別的準確率越高。并且情
訓(xùn)練作業(yè)運行失敗排查指導(dǎo) 問題現(xiàn)象 訓(xùn)練作業(yè)的“狀態(tài)”出現(xiàn)“運行失敗”的現(xiàn)象。 原因分析及處理方法 查看訓(xùn)練作業(yè)的“日志”,出現(xiàn)報錯“MoxFileNotExistsException(resp, 'file or directory or bucket not found.')”。
OOM導(dǎo)致訓(xùn)練作業(yè)失敗 問題現(xiàn)象 因為OOM導(dǎo)致的訓(xùn)練作業(yè)失敗,會有如下幾種現(xiàn)象。 錯誤碼返回137,如下圖所示。 Modelarts Service Log Trainina end with return code: 137 Modelarts Service Log]handle
-成長地圖 | 華為云
聯(lián)動修改學(xué)習(xí)率的大小,如果批量大小增大,學(xué)習(xí)率也可以適當(dāng)增加,保證模型正常收斂。 學(xué)習(xí)率衰減比率 本案例中設(shè)置為0.1。 學(xué)習(xí)率衰減后的比率,用于控制訓(xùn)練過程中學(xué)習(xí)率的下降幅度。經(jīng)過衰減后,學(xué)習(xí)率的最低值由初始學(xué)習(xí)率和衰減比率決定。其計算公式為:最低學(xué)習(xí)率 = 初始學(xué)習(xí)率 * 學(xué)
測試用戶權(quán)限 由于權(quán)限配置需要等待15-30分鐘生效,建議在配置完成后,等待30分鐘,再執(zhí)行如下驗證操作。 使用用戶組02中任意一個子用戶登錄ModelArts管理控制臺。在登錄頁面,請使用“IAM用戶登錄”方式進行登錄。 首次登錄會提示修改密碼,請根據(jù)界面提示進行修改。 驗證ModelArts權(quán)限。
刪除訓(xùn)練作業(yè)參數(shù) 功能介紹 刪除訓(xùn)練作業(yè)參數(shù)。 URI DELETE /v1/{project_id}/training-job-configs/{config_name} 參數(shù)說明如表1所示。 表1 參數(shù)說明 參數(shù) 是否必選 參數(shù)類型 說明 project_id 是 String
訓(xùn)練作業(yè)的監(jiān)控內(nèi)存指標持續(xù)升高直至作業(yè)失敗 問題現(xiàn)象 訓(xùn)練作業(yè)的“狀態(tài)”為“運行失敗”。 原因分析 訓(xùn)練作業(yè)的監(jiān)控內(nèi)存指標持續(xù)升高,導(dǎo)致最后訓(xùn)練作業(yè)失敗。 處理步驟 查詢訓(xùn)練作業(yè)的日志和監(jiān)控信息,是否存在明確的OOM報錯信息。 是,訓(xùn)練作業(yè)的日志里存在OOM報錯,執(zhí)行2。 否,訓(xùn)
String 訓(xùn)練作業(yè)參數(shù)的名稱。 請求消息 請求參數(shù)如表2所示。 表2 參數(shù)說明 參數(shù) 是否必選 參數(shù)類型 說明 config_desc 否 String 對訓(xùn)練作業(yè)的描述,默認為空,字符串的長度限制為[0,256]。 worker_server_num 是 Integer 訓(xùn)練作業(yè)w