五月婷婷丁香性爱|j久久一级免费片|久久美女福利视频|中文观看在线观看|加勒比四区三区二|亚洲裸女视频网站|超碰97AV在线69网站免费观看|有码在线免费视频|久久青青日本视频|亚洲国产AAAA

數(shù)據(jù)管理有哪些功能?

數(shù)據(jù)管理平臺提供了聚類分析、數(shù)據(jù)特征分析、數(shù)據(jù)清洗、數(shù)據(jù)校驗、數(shù)據(jù)增強、數(shù)據(jù)選擇等分析處理能力,可幫助開發(fā)者進一步理解數(shù)據(jù)和挖掘數(shù)據(jù),從而準備出一份滿足開發(fā)目標或項目要求的高價值數(shù)據(jù)。

開發(fā)者在數(shù)據(jù)管理平臺可以在線完成圖像分類、目標檢測、音頻分割、文本三元組、視頻分類等各種標注場景,同時也可以使用ModelArts智能標注方案,通過預置算法或自定義算法代替人工完成數(shù)據(jù)標注,提升標注效率。

針對大規(guī)模協(xié)同標注場景,數(shù)據(jù)管理平臺還提供了強大的團隊標注,支持標注團隊管理、人員管理、角色管理等,實現(xiàn)從項目的創(chuàng)建、數(shù)據(jù)分配、進度把控、標注、審核、驗收全流程。為用戶帶來標注效率提升的同時,又最小化項目管理開銷。

此外,數(shù)據(jù)管理平臺時刻保障用戶數(shù)據(jù)的安全性和隱私性,確保用戶數(shù)據(jù)僅在授權范圍內使用。

數(shù)據(jù)集管理

數(shù)據(jù)集支持的類型

文件型

  1. 圖片:對圖像類數(shù)據(jù)進行處理,支持 .jpg、.png、.jpeg、.bmp四種圖像格式,支持用戶進行圖像分類、物體檢測、圖像分割類型的標注。
  2. 音頻:對音頻類數(shù)據(jù)進行處理,支持.wav格式,支持用戶進行聲音分類、語音內容、語音分割三種類型的標注。
  3. 文本:對文本類數(shù)據(jù)進行處理,支持.txt、.csv格式,支持用戶進行文本分類、命名實體、文本三元組三種類型的標注。
  4. 視頻:對視頻類數(shù)據(jù)進行處理,支持.mp4格式,支持用戶進行視頻標注。
  5. 自由格式:管理的數(shù)據(jù)可以為任意格式,目前不支持標注,適用于無需標注或開發(fā)者自行定義標注的場景。如果您的數(shù)據(jù)集需存在多種格式數(shù)據(jù),或者您的數(shù)據(jù)格式不符合其他類型數(shù)據(jù)集時,可選擇自由格式的數(shù)據(jù)集

表格型

  1. 表格:適合表格等結構化數(shù)據(jù)處理。數(shù)據(jù)格式支持csv和carbon。不支持標注,支持對部分表格數(shù)據(jù)進行預覽,但是最多支持100條數(shù)據(jù)預覽。

如何快速在數(shù)據(jù)管理平臺創(chuàng)建數(shù)據(jù)集

須知

1.數(shù)據(jù)管理功能需要獲取訪問OBS權限,在未進行委托授權之前,無法使用此功能。在使用數(shù)據(jù)管理功能之前,請前往“全局配置”頁面,使用委托完成訪問授權。

2.已創(chuàng)建用于存儲數(shù)據(jù)的OBS桶及文件夾。并且,數(shù)據(jù)存儲的OBS桶與ModelArts在同一區(qū)域。當前不支持OBS并行文件系統(tǒng),請選擇OBS對象存儲。

3.ModelArts不支持加密的OBS桶,創(chuàng)建OBS桶時,請勿開啟桶加密。

在數(shù)據(jù)管理平臺創(chuàng)建數(shù)據(jù)集

1.登錄ModelArts管理控制臺,選擇數(shù)據(jù)管理>數(shù)據(jù)集。

2.單擊創(chuàng)建數(shù)據(jù)集。

3.選擇數(shù)據(jù)類型與數(shù)據(jù)來源以及導入路徑。

4.單擊提交,完成數(shù)據(jù)集的創(chuàng)建。

創(chuàng)建數(shù)據(jù)集時的數(shù)據(jù)接入:

1.從OBS導入數(shù)據(jù),創(chuàng)建數(shù)據(jù)集。

2.從本地上傳數(shù)據(jù),創(chuàng)建數(shù)據(jù)集。

3.從AI Gallery下載數(shù)據(jù),創(chuàng)建數(shù)據(jù)集。

4.從DLI導入數(shù)據(jù)。

5.從MRS導入數(shù)據(jù)。

6.從DWS導入數(shù)據(jù)。

數(shù)據(jù)管理-人工標注

圖片標注

ModelArts數(shù)據(jù)標注中的圖片標注指圖片類型的數(shù)據(jù)集進行標注。圖片標注的標注作業(yè)類型,分為“圖像分類”、“物體檢測”、“圖像分割”三種標注類型。

文本標注

文本場景的標注主要為“文本分類”、“命名實體”、“文本三元組”。

分別支持對文本的內容按照標簽進行分類處理。

對文本中的實體片段進行標注。

對文本的實體片段以及實體之間的關系進行標注。

音頻標注

對聲音進行分類。

對語音內容進行標注。

對語音進行分段標注。

視頻標注

由于模型訓練過程需要大量有標簽的視頻數(shù)據(jù),因此在模型訓練之前需對沒有標簽的視頻添加標簽。通過ModelArts您可對視頻添加標簽,快速完成對視頻的標注操作,也可以對已標注視頻修改或刪除標簽進行重新標注。

數(shù)據(jù)管理-智能標注

除了人工標注外,ModelArts數(shù)據(jù)管理平臺還提供了智能標注功能,快速完成數(shù)據(jù)標注,為您節(jié)省70%以上的標注時間。數(shù)據(jù)管理中的智能標注是指基于當前標注階段的標簽及圖片學習訓練,選中系統(tǒng)中已有的模型進行智能標注,快速完成剩余圖片的標注操作。

須知:

  1. 目前只有“圖像分類”和“物體檢測”類型的標注作業(yè)支持智能標注功能。
  2. 啟動智能標注時,需標注作業(yè)存在至少2種標簽,且每種標簽已標注的圖片不少于5張。
  3. 啟動智能標注時,必須存在未標注圖片。
  4. 啟動智能標注前,保證當前系統(tǒng)中不存在正在進行中的智能標注任務。
  5. 檢查用于標注的圖片數(shù)據(jù),確保您的圖片數(shù)據(jù)中,不存在RGBA四通道圖片。如果存在四通道圖片,智能標注任務將運行失敗,因此,請從數(shù)據(jù)集中刪除四通道圖片后,再啟動智能標注。

啟動智能標注:

  1. 1.登錄ModelArts管理控制臺,在左側菜單欄中選擇“數(shù)據(jù)管理 > 數(shù)據(jù)標注”,進入“數(shù)據(jù)標注”管理頁面。
  2. 2.在標注作業(yè)列表中,選擇“物體檢測”或“圖像分類”類型的標注作業(yè),單擊操作列的“智能標注”啟動智能標注作業(yè)。
  3. 3.在彈出的“啟動智能標注”對話框中,選擇智能標注類型,可選“主動學習”或者“預標注”。
  4. 4.完成參數(shù)設置后,單擊“提交”,即可啟動智能標注。
  5. 5.在標注作業(yè)列表中,單擊標注作業(yè)名稱進入“標注作業(yè)詳情”頁。
  6. 6.在“數(shù)據(jù)集概覽頁標注作業(yè)詳情頁”,選擇“標注”頁簽,單擊“待確認”頁簽,即可查看智能標注進度。您也可以在該頁簽,“啟動智能標注”或者查看“智能標注歷史”

數(shù)據(jù)管理-團隊標注

數(shù)據(jù)管理平臺針對數(shù)據(jù)集較大的數(shù)據(jù)標注任務,需要多人協(xié)助完成。ModelArts提供了團隊標注功能,可以由多人組成一個標注團隊,針對同一個數(shù)據(jù)集進行標注管理。

創(chuàng)建團隊標注任務

1.在創(chuàng)建標注作業(yè)時,即啟用團隊標注,且指派某一團隊負責標注。

2.團隊標注功能當前僅支持“圖像分類”、“物體檢測”、“文本分類”、“命名實體”、“文本三元組”、“語音分割”類型的數(shù)據(jù)集。

登錄ModelArts-console

1.團隊標注任務創(chuàng)建成功后,團隊成員收到標注任務的郵件。

2.單擊任務郵件中的標注任務地址,跳轉至ModelArts數(shù)據(jù)管理>數(shù)據(jù)標注頁面的“我參與的”頁簽。

3.在“我參與的”頁簽下,可查看您的標注任務。

啟動團隊標注

在標注頁面中,每個成員可查看“未標注”、“待確認”、“已駁回”、“待審核”、“審核通過”、“驗收通過”的圖片信息。請及時關注管理員駁回以及待修正的圖片。

當團隊標注任務中,分配了Reviewer角色,則需要對標注結果進行審核,審核完成后,再提交給管理員驗收。

審核標注結果

1.團隊審核者在任務列表“操作”列單擊“審核”,發(fā)起審核。

2.在審核頁面中,審核人員可以查看“未審核”、“已審核”、“審核通過”、“審核不通過”的樣本。

3.審核人員可以在審核頁面的右側選擇“審核結果”。

驗收標注結果

1.管理員進入“標注作業(yè)詳情頁”,單擊右上角“驗收”,發(fā)起驗收。

2.設置抽樣策略,啟動驗收。

3.在實時驗收報告中選擇驗收結果。

4.查看驗收報告。

5.驗收結束后刪除標注任務。

數(shù)據(jù)管理-數(shù)據(jù)發(fā)布

須知

  1. 1.數(shù)據(jù)管理中針對剛創(chuàng)建的數(shù)據(jù)集(未發(fā)布前),無數(shù)據(jù)集版本信息,必須執(zhí)行發(fā)布操作后,才能應用于模型開發(fā)或訓練。
  2. 2.在數(shù)據(jù)管理中數(shù)據(jù)集版本,默認按V001、V002遞增規(guī)則進行命名,您也可以在發(fā)布時自定義設置。
  3. 3.您可以將任意一個版本設置為當前目錄,即表示數(shù)據(jù)集列表中進入的數(shù)據(jù)集詳情,為此版本的數(shù)據(jù)及標注信息。
  4. 4.數(shù)據(jù)管理針對每一個數(shù)據(jù)集版本,您可以通過“存儲路徑”參數(shù),獲得此版本對應的Manifest文件格式的數(shù)據(jù)集??捎糜趯霐?shù)據(jù)或難例篩選操作。
  5. 5.表格數(shù)據(jù)集暫不支持切換版本。

操作步驟

  1. 1.登錄ModelArts管理控制臺,在左側菜單欄中選擇“數(shù)據(jù)管理> 數(shù)據(jù)集”,進入“數(shù)據(jù)集”管理頁面。
  2. 2.在數(shù)據(jù)集列表中,單擊操作列的“發(fā)布”。或者,您可以單擊數(shù)據(jù)集名稱,進入數(shù)據(jù)集“概覽”頁,在頁面右上角單擊“發(fā)布”。
  3. 3.在“發(fā)布新版本”彈出框中,填寫發(fā)布數(shù)據(jù)集的相關參數(shù),然后單擊“確定”。

數(shù)據(jù)管理常見問題

  • 數(shù)據(jù)管理中的團隊標注的數(shù)據(jù)分配機制是什么?

    數(shù)據(jù)管理團隊標注目前不支持用戶自定義成員任務分配,數(shù)據(jù)是平均分配的。

    當數(shù)量和團隊成員人數(shù)不成比例,無法平均分配時,則將多余的幾張圖片,隨機分配給團隊成員。

    如果樣本數(shù)少于待分配成員時,部分成員會存在未分配到樣本的情況。樣本只會分配給labeler,比如10000張都是未標注,且5個都是labeler的話,那就是每個人分2000。

  • 數(shù)據(jù)管理中團隊標注的完成驗收的各選項表示什么意思?

    1.全部通過:被駁回的樣本,也會通過。

    2.全部駁回時:已經通過的樣本,需要重新標注,下次驗收時重新進行審核。

    3.剩余全部通過:已經駁回的會駁回,其余會自動驗收通過。

    4.剩余全部駁回時,樣本抽中的通過的,不需要標注了,未通過和樣本未抽中的需要重新標注驗收。

  • 數(shù)據(jù)管理的視頻數(shù)據(jù)集無法顯示和播放視頻?

    若無法顯示和播放視頻,請檢查視頻格式類型,目前只支持MP4格式。

  • 數(shù)據(jù)管理表格類型的數(shù)據(jù)集如何標注?

    表格類型的數(shù)據(jù)集適合表格等結構化數(shù)據(jù)處理。數(shù)據(jù)格式支持csv。不支持標注,支持對部分表格數(shù)據(jù)進行預覽,但是最多支持100條數(shù)據(jù)預覽。

  • 數(shù)據(jù)管理中如何將兩個數(shù)據(jù)集合并?

    目前不支持直接合并。

    但是可以參考如下操作方式,將兩個數(shù)據(jù)集的數(shù)據(jù)合并在一個數(shù)據(jù)集中。

    例如需將數(shù)據(jù)集A和數(shù)據(jù)集B進行合并。

    1.分別將數(shù)據(jù)集A和數(shù)據(jù)集B進行發(fā)布。

    2.發(fā)布后可獲得數(shù)據(jù)集A和數(shù)據(jù)集B的Manifest文件??赏ㄟ^數(shù)據(jù)集的“數(shù)據(jù)集輸出位置”獲得此文件。

    3.創(chuàng)建一個空數(shù)據(jù)集C,即無任何輸出,其輸入位置選擇一個空的OBS文件夾。

    4.在數(shù)據(jù)集C中,執(zhí)行導入數(shù)據(jù)操作,將數(shù)據(jù)集A和數(shù)據(jù)集B的Manifest文件導入。導入完成后,即將數(shù)據(jù)集A和數(shù)據(jù)集B的數(shù)據(jù)分別都合并至數(shù)據(jù)集C中。如需使用合并后的數(shù)據(jù)集,再針對數(shù)據(jù)集C執(zhí)行發(fā)布操作即可。

  • 數(shù)據(jù)管理模塊團隊標注時,為什么團隊成員收不到郵件?

    團隊標注時,成員收不到郵件的可能原因如下:

    1.當數(shù)據(jù)集中的所有數(shù)據(jù)已完成標注,即“未標注”數(shù)據(jù)為空時,創(chuàng)建的團隊標注任務,因為沒有數(shù)據(jù)需要標注,不會給團隊成員發(fā)送標注郵件。在發(fā)起團隊標注任務時,請確保數(shù)據(jù)集中存在“未標注”數(shù)據(jù)。

    2.只有當創(chuàng)建團隊標注任務時,標注人員才會收到郵件。創(chuàng)建標注團隊及添加標注團隊的成員并不會發(fā)送郵件。

    3.請確保您的郵箱已完成配置且配置無誤??蓞⒖脊芾沓蓡T,完成郵箱配置。

    4.團隊成員自檢其郵箱是否有攔截設置。

  • 數(shù)據(jù)管理的智能標注完成后新加入數(shù)據(jù)是否需要重新訓練?

    智能標注完成后,需要對標注數(shù)據(jù)確認,如果未確認,直接加入更多數(shù)據(jù),重新智能標注,會重新全部將未標注的數(shù)據(jù)全部重新訓練標注。如果確認了后,再加入未標注的數(shù)據(jù),需要重新訓練。

  • 數(shù)據(jù)管理導入數(shù)據(jù)集失???

    導入數(shù)據(jù)集失敗可能原因為OBS桶類型選擇錯誤,請您選擇標準存儲類型的桶導入。