檢測到您已登錄華為云國際站賬號(hào),為了您更好的體驗(yàn),建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
text2.json #該文本文件的所有標(biāo)注信息 標(biāo)注數(shù)據(jù).json文件說明 數(shù)據(jù)集中必含“.json”文件,用于集合該文本文件的所有標(biāo)注數(shù)據(jù)信息,包括該文本所在的項(xiàng)目id、數(shù)據(jù)包id、文本上所有標(biāo)注信息等。上傳數(shù)據(jù)集前請保證“.json”文件內(nèi)容正確。“.json”文件編寫的參考樣例如下:
人臉數(shù)據(jù)集: https://zhuanlan.zhihu.com/p/48347016 關(guān)鍵點(diǎn)檢測數(shù)據(jù)集 檢測到人臉后,通常都需要定位出圖像的輪廓關(guān)鍵點(diǎn),關(guān)鍵點(diǎn)是人臉形狀的稀疏表示,在人臉跟蹤,美顏等任務(wù)中都很重要,現(xiàn)在已經(jīng)從最開始的5個(gè)
單擊“自動(dòng)Mapping”,源端和目標(biāo)端數(shù)據(jù)字段間的映射規(guī)則自動(dòng)建立。 圖1 自動(dòng)Mapping 手動(dòng)配置Mapping 如果兩端的數(shù)據(jù)表字段不一致,可單擊下方的“添加mapping映射”,配置源端數(shù)據(jù)字段到目標(biāo)端數(shù)據(jù)字段的映射關(guān)系。 用戶可以手動(dòng)添加源端數(shù)據(jù)字段與目標(biāo)端數(shù)據(jù)字段的映射規(guī)則,該方式
視頻類數(shù)據(jù)集格式要求 ModelArts Studio大模型開發(fā)平臺(tái)支持創(chuàng)建視頻類數(shù)據(jù)集,創(chuàng)建時(shí)可導(dǎo)入多種形式的數(shù)據(jù),具體格式要求詳見表1。 表1 視頻類數(shù)據(jù)集格式要求 文件內(nèi)容 文件格式 文件要求 視頻 mp4或avi 支持mp4、avi視頻格式上傳,所有視頻可以放在多個(gè)文件夾
音頻類數(shù)據(jù)集格式要求 ModelArts Studio大模型開發(fā)平臺(tái)支持創(chuàng)建音頻類數(shù)據(jù)集,創(chuàng)建時(shí)可導(dǎo)入多種形式的數(shù)據(jù),具體格式要求詳見表1 表1 音頻類數(shù)據(jù)集格式要求 文件內(nèi)容 文件格式 文件要求 音頻 音頻+jsonl(可選) 音頻格式支持:mp3、flac、wav、opus、
文本類數(shù)據(jù)集格式要求 ModelArts Studio大模型開發(fā)平臺(tái)支持創(chuàng)建文本類數(shù)據(jù)集,創(chuàng)建時(shí)可導(dǎo)入多種形式的數(shù)據(jù),具體格式要求詳見表1。 表1 文本類數(shù)據(jù)集格式要求 文件內(nèi)容 文件格式 文件要求 文檔 txt、mobi、epub、docx、pdf 從OBS導(dǎo)入:單個(gè)文件大小不超過1GB,文件數(shù)量不限制。
使用日志查看數(shù)據(jù)集加工進(jìn)度 平臺(tái)通過記錄任務(wù)運(yùn)行日志提供對加工數(shù)據(jù)集的查看加工進(jìn)度操作,具體步驟如下: 登錄ModelArts Studio大模型開發(fā)平臺(tái),在“我的空間”模塊,單擊進(jìn)入所需空間。 圖1 我的空間 在左側(cè)導(dǎo)航欄中選擇“數(shù)據(jù)工程 > 數(shù)據(jù)加工 > 加工任務(wù)”。 單擊任
b.com/zq2599/blog_demos 本篇概覽 在學(xué)習(xí)和開發(fā)flink的過程中,經(jīng)常需要準(zhǔn)備數(shù)據(jù)集用來驗(yàn)證我們的程序,阿里云天池公開數(shù)據(jù)集中有一份淘寶用戶行為數(shù)據(jù)集,稍作處理后即可用于flink學(xué)習(xí); 下載 下載地址: https://tianchi.aliyun
配置數(shù)據(jù)映射規(guī)則 概述 本節(jié)主要提供數(shù)據(jù)集成任務(wù)Mapping信息的配置說明。Mapping信息用于告訴ROMA Connect源端數(shù)據(jù)字段到目標(biāo)端數(shù)據(jù)字段的映射規(guī)則,把獲取到的源端數(shù)據(jù)轉(zhuǎn)換成寫入目標(biāo)端的數(shù)據(jù)。 約束與限制 源端與目標(biāo)端字段名請勿使用對應(yīng)數(shù)據(jù)庫的關(guān)鍵字,否則可能導(dǎo)致任務(wù)運(yùn)行異常。
發(fā)布數(shù)據(jù)集 企業(yè)A將自己的需要預(yù)測的csv數(shù)據(jù)文件上傳到自己的計(jì)算節(jié)點(diǎn)上,通過“數(shù)據(jù)管理”模塊創(chuàng)建用于預(yù)測的數(shù)據(jù)集。 企業(yè)A預(yù)測數(shù)據(jù)集如下: 大數(shù)據(jù)廠商B仍使用訓(xùn)練時(shí)的提供的全量數(shù)據(jù)作為預(yù)測數(shù)據(jù)集,沒有發(fā)布新的數(shù)據(jù)集。 父主題: 使用TICS聯(lián)邦預(yù)測進(jìn)行新數(shù)據(jù)離線預(yù)測
頁面數(shù)據(jù)集 操作場景 通過頁面數(shù)據(jù)集,實(shí)現(xiàn)多個(gè)組件對接同一個(gè)數(shù)據(jù)輸入,減少重復(fù)的請求和配置。同時(shí),在新建頁面數(shù)據(jù)集時(shí),還支持配置多數(shù)據(jù)輸入(最多10個(gè)),來實(shí)現(xiàn)組件同時(shí)對接多個(gè)數(shù)據(jù)流。 本章節(jié)以將兩個(gè)靜態(tài)數(shù)據(jù)集(多數(shù)據(jù)流1、多數(shù)據(jù)流2)中的數(shù)據(jù)匯合后,作為組件的數(shù)據(jù)來源為例,向您介紹如何創(chuàng)建并使用頁面數(shù)據(jù)集。
audio2.json #該音頻文件的所有標(biāo)注信息 標(biāo)注數(shù)據(jù).json文件說明 數(shù)據(jù)集中必含“.json”文件,用于集合該音頻文件的所有標(biāo)注數(shù)據(jù)信息,包括該音頻所在的項(xiàng)目id、數(shù)據(jù)包id、音頻上所有標(biāo)注信息等。上傳數(shù)據(jù)集前請保證“.json”文件內(nèi)容正確。“.json”文件編寫的參考樣例如下:
線上數(shù)據(jù)集規(guī)模和提供的數(shù)據(jù)集差別大嗎
氣象類數(shù)據(jù)集格式要求 ModelArts Studio大模型開發(fā)平臺(tái)支持導(dǎo)入氣象類數(shù)據(jù)集,該數(shù)據(jù)集當(dāng)前包括海洋氣象數(shù)據(jù)。 海洋氣象數(shù)據(jù)通常來源于氣象再分析。氣象再分析是通過現(xiàn)代氣象模型和數(shù)據(jù)同化技術(shù),重新處理歷史觀測數(shù)據(jù),生成高質(zhì)量的氣象記錄。這些數(shù)據(jù)既可以覆蓋全球范圍,也可以針
發(fā)布數(shù)據(jù)集 企業(yè)A和大數(shù)據(jù)廠商B分別將自己的csv數(shù)據(jù)文件上傳到自己的計(jì)算節(jié)點(diǎn)上,通過“數(shù)據(jù)管理”模塊創(chuàng)建各自的數(shù)據(jù)集。 企業(yè)A的數(shù)據(jù)集如下: 大數(shù)據(jù)廠商B的數(shù)據(jù)集如下: 創(chuàng)建數(shù)據(jù)集后單擊“發(fā)布”按鈕即可將數(shù)據(jù)的元數(shù)據(jù)信息發(fā)布到tics空間側(cè),供其他合作方參考。 父主題: 使用TICS多方安全計(jì)算進(jìn)行聯(lián)合樣本分布統(tǒng)計(jì)
發(fā)布數(shù)據(jù)集 企業(yè)A和大數(shù)據(jù)廠商B分別將自己的csv數(shù)據(jù)文件上傳到自己的計(jì)算節(jié)點(diǎn)上,通過“數(shù)據(jù)管理”模塊創(chuàng)建各自的數(shù)據(jù)集。 企業(yè)A的數(shù)據(jù)集如下: 大數(shù)據(jù)廠商B的數(shù)據(jù)集如下: 創(chuàng)建數(shù)據(jù)集后單擊“發(fā)布”按鈕即可將數(shù)據(jù)的元數(shù)據(jù)信息發(fā)布到tics空間側(cè),供其他合作方參考。 父主題: 使用TICS可信聯(lián)邦學(xué)習(xí)進(jìn)行聯(lián)邦建模
數(shù)據(jù)集配置 操作步驟 采用組件庫中圖表組件來展示數(shù)據(jù)集。 參考綁定設(shè)備實(shí)例數(shù)據(jù),數(shù)據(jù)類型新增數(shù)據(jù)集,然后根據(jù)數(shù)據(jù)集歷史查詢接口,配置數(shù)據(jù)集類型,數(shù)據(jù)集ID,起止時(shí)間等字段。 當(dāng)前圖表組件數(shù)據(jù)來源有兩種,分別是靜態(tài)數(shù)據(jù)和系統(tǒng)集成,因此增加數(shù)據(jù)集類型數(shù)據(jù),整理如下: 靜態(tài)數(shù)據(jù); 系統(tǒng)集成(需配置產(chǎn)品,設(shè)備實(shí)例);
象進(jìn)而過濾數(shù)據(jù)集。 業(yè)務(wù)對象 各個(gè)主題域中管理的對象,選擇業(yè)務(wù)對象,篩選與對應(yīng)業(yè)務(wù)對象相關(guān)的數(shù)據(jù)集。 容器 容器在應(yīng)用元模型中與數(shù)據(jù)集相關(guān)聯(lián),選擇容器,篩選與對應(yīng)容器相關(guān)的數(shù)據(jù)集。 數(shù)據(jù)平臺(tái)實(shí)例 數(shù)據(jù)平臺(tái)實(shí)例在應(yīng)用元模型中與數(shù)據(jù)集相關(guān)聯(lián),選擇數(shù)據(jù)平臺(tái)實(shí)例,篩選與對應(yīng)數(shù)據(jù)平臺(tái)實(shí)例相關(guān)的數(shù)據(jù)集。
數(shù)據(jù)集成權(quán)限 表1 數(shù)據(jù)集成權(quán)限 權(quán)限 對應(yīng)API接口 授權(quán)項(xiàng)(Action) 依賴的授權(quán)項(xiàng) IAM項(xiàng)目 (Project) 企業(yè)項(xiàng)目 (Enterprise Project) 創(chuàng)建任務(wù) POST /v2/{project_id}/fdi/instances/{instance_id}/tasks
發(fā)布數(shù)據(jù)集 企業(yè)B分別自己的csv數(shù)據(jù)文件上傳到自己的計(jì)算節(jié)點(diǎn)上,通過“數(shù)據(jù)管理”模塊創(chuàng)建各自的數(shù)據(jù)集,并單擊“發(fā)布”。 企業(yè)B的數(shù)據(jù)集如下: 創(chuàng)建數(shù)據(jù)集后單擊“發(fā)布”按鈕即可將數(shù)據(jù)的元數(shù)據(jù)信息發(fā)布到tics空間側(cè),供其他合作方參考。 父主題: 外部數(shù)據(jù)共享