五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

模型訓練亮點特性

  • 收起 展開
    訓練模式選擇 收起 展開

    針對常見AI引擎,ModelArts提供訓練模式選擇,支持用戶根據(jù)實際場景獲取不同的診斷信息。在訓練作業(yè)創(chuàng)建頁面,支持普通模式、高性能模式和故障診斷模式,默認設(shè)置為普通模式。

    了解更多
  • 收起 展開
    分布式訓練 收起 展開

    主要介紹基于Pytorch引擎的單機多卡數(shù)據(jù)并行訓練、多機多卡數(shù)據(jù)并行訓練。同時,也提供了分布式訓練的適配教程和分布式調(diào)測的代碼示例,可在PyCharm/VSCode/JupyterLab等開發(fā)工具中調(diào)試分布式訓練。

    了解更多
  • 收起 展開
    模型訓練加速 收起 展開

    針對AI訓練場景中大模型Checkpoint保存和加載帶來的I/O挑戰(zhàn),華為云提供了基于對象存儲服務(wù)OBS+高性能文件服務(wù)SFS Turbo的AI云存儲解決方案。

    了解更多

模型訓練常見問題

  • 本地導(dǎo)入的算法有哪些格式要求?

    ModelArts支持導(dǎo)入本地開發(fā)的算法,格式要求如下:

    1. 編程語言不限。
    2. 啟動文件必須選擇以“.py”結(jié)尾的文件。
    3. 文件數(shù)(含文件、文件夾數(shù)量)不超過1024個。
    4. 文件總大小不超過5GB。


  • ModelArts訓練好后的模型如何獲?。?/div>

    使用自動學習產(chǎn)生的模型只能在ModelArts上部署上線,無法下載至本地使用。

    使用自定義算法或者訂閱算法訓練生成的模型,會存儲至用戶指定的OBS路徑中,供用戶下載。

  • 是否支持圖像分割任務(wù)的訓練?

    支持。您可以使用以下三種方式實現(xiàn)圖像分割任務(wù)的訓練。

    1. 您可以在AI Gallery訂閱相關(guān)圖像分割任務(wù)算法,并使用訂閱算法完成訓練。
    2. 如果您在本地使用ModelArts支持的常用框架完成了訓練腳本,可以使用自定義腳本創(chuàng)建訓練作業(yè)。
    3. 如果您在本地開發(fā)的算法不是基于常用框架,您可以選擇使用自定義鏡像創(chuàng)建訓練作業(yè)。
  • 訓練作業(yè)常用文件路徑是什么?

    訓練環(huán)境的當前目錄以及代碼目錄在容器的位置一般通過環(huán)境變量${MA_JOB_DIR}讀取,${MA_JOB_DIR}變量對應(yīng)的實際值是/home/ma-user/modelarts/user-job-dir。

  • 創(chuàng)建訓練作業(yè)時提示“對象目錄大小/數(shù)量超過限制”,如何解決?

    問題分析

    創(chuàng)建訓練作業(yè)選擇的代碼目錄有大小和文件個數(shù)限制。

    解決方法

    將代碼目錄中除代碼以外的文件刪除或存放到其他目錄,保證代碼目錄大小不超過128MB,文件個數(shù)不超過4096個。

  • 訓練作業(yè)的“/cache”目錄是否安全?

    ModelArts訓練作業(yè)的程序運行在容器中,容器掛載的目錄地址是唯一的,只有運行時的容器能訪問到。因此訓練作業(yè)的“/cache”是安全的。

  • 如何查看訓練作業(yè)資源占用情況?

    ModelArts管理控制臺,選擇“訓練管理>訓練作業(yè)”,進入訓練作業(yè)列表頁面。在訓練作業(yè)列表中,單擊目標作業(yè)名稱,查看該作業(yè)的詳情。您可以在“資源占用情況”頁簽查看到如下指標信息。

    1. CPU:CPU使用率(cpuUsage)百分比(Percent)。
    2. MEM:物理內(nèi)存使用率(memUsage)百分比(Percent)。
    3. GPU:GPU使用率(gpuUtil)百分比(Percent)。
    4. GPU_MEM:顯存使用率(gpuMemUsage)百分比(Percent)。