AI開發(fā)過程中經(jīng)常需要處理海量數(shù)據(jù),數(shù)據(jù)準備與標注往往耗費整體開發(fā)一半以上時間。ModelArts數(shù)據(jù)管理提供了一套高效便捷的管理和標注數(shù)據(jù)框架。不僅支持圖片、文本、語音、視頻等多種數(shù)據(jù)類型,涵蓋圖像分類、目標檢測、音頻分割、文本分類等多個標注場景,可適用于各種AI項目,如計算機視覺、自然語言處理、音視頻分析等;同時提供數(shù)據(jù)篩選、數(shù)據(jù)分析、數(shù)據(jù)處理、智能標注、團隊標注以及版本管理等功能,AI開發(fā)者可基于該框架實現(xiàn)數(shù)據(jù)標注全流程處理。如圖所示。
圖1數(shù)據(jù)標注全流程
據(jù)管理的功能.jpg)
ModelArts數(shù)據(jù)管理為 數(shù)據(jù)集 提供聚類分析、數(shù)據(jù)清洗、數(shù)據(jù)增強、數(shù)據(jù)選擇、特征分析等處理,可幫助開發(fā)者進一步理解數(shù)據(jù)、篩選數(shù)據(jù)、挖掘數(shù)據(jù)信息,從而準備出一份滿足開發(fā)目標或項目要求的高價值數(shù)據(jù)。
開發(fā)者可利用數(shù)據(jù)管理提供的各個場景標注工具進行數(shù)據(jù)標注,也可以選擇多種標注方式,包括通過預置算法或用戶自定義算法訓練得到的模型進行智能標注,僅需少量人工標注和修正則可以得到較準確的標注結果;通過創(chuàng)建團隊進行多人合作標注,提升標注效率。滿足個人開發(fā)者的獨立標注、小團隊的協(xié)作標注,和專業(yè)團隊的大規(guī)模協(xié)同標注及項目化管理。
針對大規(guī)模團隊的標注,提供專業(yè)的團隊管理、人員管理、數(shù)據(jù)管理,實現(xiàn)從項目創(chuàng)建、分配、管理、標注、驗收全流程。針對個人、小團隊、小規(guī)模協(xié)作標注,提供便捷易用的標注工具,最小化項目管理開銷。
此外,標注平臺確保用戶 數(shù)據(jù)安全 性,確保用戶數(shù)據(jù)僅在授權范圍內(nèi)使用,標注對象分配策略確保用戶數(shù)據(jù)的隱私性,實現(xiàn)標注數(shù)據(jù)脫敏需求。