檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務(wù)網(wǎng)站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
Dataset:數(shù)據(jù)集集合(NLP方向數(shù)據(jù)集)——常見的自然語言處理數(shù)據(jù)集大集合(建議收藏,持續(xù)更新) 目錄 NLP數(shù)據(jù)集特點 常見的NLP數(shù)據(jù)集 1、生物數(shù)據(jù)集以及自然語言處理數(shù)據(jù)集 常見的使用案例 NLP數(shù)據(jù)集特點 文本相對容易收集和存
配置對話流程 本章節(jié)以調(diào)用實時天氣接口為例配置“查天氣”對話流程。 配置對話流程包含以下幾個步驟: 步驟1:新建條件判斷節(jié)點 步驟2:新建信息收集節(jié)點 步驟3:新建接口調(diào)用節(jié)點 步驟4:新建對話回復(fù)節(jié)點(分支1) 步驟5:新建對話回復(fù)節(jié)點(分支2) 步驟6:檢測對話流程 步驟1:新建條件判斷節(jié)點
預(yù)測類數(shù)據(jù)集格式要求 平臺支持創(chuàng)建預(yù)測類數(shù)據(jù)集,您可以參考預(yù)測數(shù)據(jù)集構(gòu)建規(guī)范,確保創(chuàng)建可用的預(yù)測類數(shù)據(jù)集。當(dāng)前平臺支持時序分類數(shù)據(jù)、時序回歸數(shù)據(jù)、結(jié)構(gòu)化分類數(shù)據(jù)、結(jié)構(gòu)化回歸數(shù)據(jù)四類預(yù)測數(shù)據(jù)集。四類數(shù)據(jù)集說明如下: 時序分類數(shù)據(jù):含有時間標(biāo)記的數(shù)據(jù)序列,輸入列為特征列,目標(biāo)列是離散值,并具有有限的可能取值。
數(shù)據(jù)集 數(shù)據(jù)集主要包含兩塊:左側(cè)樹狀導(dǎo)航展示數(shù)據(jù)集路徑、右側(cè)可進行新建數(shù)據(jù)集操作。 圖1 數(shù)據(jù)集 數(shù)據(jù)集可以直接從數(shù)據(jù)源在線導(dǎo)入,也可以離線導(dǎo)入本地文件。 圖2 數(shù)據(jù)集導(dǎo)入 單擊“數(shù)據(jù)集”,可看到該數(shù)據(jù)集詳情和元數(shù)據(jù)信息。 圖3 數(shù)據(jù)集詳情 圖4 元數(shù)據(jù) 父主題: DataLab用戶手冊
評估數(shù)據(jù)集 數(shù)據(jù)評估介紹 數(shù)據(jù)評估旨在通過對數(shù)據(jù)集進行系統(tǒng)的質(zhì)量檢查,評估其數(shù)據(jù)質(zhì)量和代表性等多個維度,發(fā)現(xiàn)潛在問題并加以解決。通常來說,數(shù)據(jù)評估遵循以下方法進行: 質(zhì)量評估: 數(shù)據(jù)集質(zhì)量評估:可以通過抽樣評估的方式,隨機抽取數(shù)據(jù)集中的樣本,使用人工或自動打分的方式,來對數(shù)據(jù)集的質(zhì)量進行打分。
在左側(cè)導(dǎo)航欄中選擇“數(shù)據(jù)工程 > 數(shù)據(jù)加工 > 配比任務(wù)”,單擊界面右上角“創(chuàng)建配比任務(wù)”。 在“數(shù)據(jù)集模態(tài)”頁簽選擇需要做數(shù)據(jù)配比的對應(yīng)數(shù)據(jù)集模態(tài),支持文本、圖片、視頻、預(yù)測類數(shù)據(jù)集做數(shù)據(jù)配比任務(wù),如圖1所示。 圖1 數(shù)據(jù)集模態(tài) 在“選擇數(shù)據(jù)集”頁簽選擇需要配比的文本類數(shù)據(jù)集(至少選擇兩個),單擊“下一步”。
標(biāo)注幀”。 標(biāo)注數(shù)據(jù)集 可選擇“全部數(shù)據(jù)集”、“已標(biāo)注數(shù)據(jù)集”。 難例數(shù)據(jù)集 可選擇“全部數(shù)據(jù)集”、“僅難例數(shù)據(jù)集”、“非難例數(shù)據(jù)集”。 數(shù)據(jù)來源:OBS 表3 數(shù)據(jù)來源為OBS的數(shù)據(jù)集 參數(shù) 說明 數(shù)據(jù)來源 選擇數(shù)據(jù)來源,此處選擇“OBS”。 數(shù)據(jù)類型 選擇數(shù)據(jù)類型,可選擇“圖
數(shù)據(jù)集 選擇在“數(shù)據(jù)中心”中配置的數(shù)據(jù)集,作為組件數(shù)據(jù)來源。選擇此方式時,請確保數(shù)據(jù)集已在數(shù)據(jù)中心創(chuàng)建,詳情請參見數(shù)據(jù)中心。 數(shù)據(jù)集 參考登錄華為云Astro大屏應(yīng)用界面中操作,登錄華為云Astro大屏應(yīng)用界面。 在編輯頁面狀態(tài)下,選中組件,單擊組件上方的。 在數(shù)據(jù)類型中,選擇“數(shù)據(jù)集”。
內(nèi)置屬性:三元組關(guān)系標(biāo)簽的指向?qū)嶓w類型,創(chuàng)建關(guān)系標(biāo)簽時必須指定,該參數(shù)僅文本三元組數(shù)據(jù)集使用。 響應(yīng)參數(shù) 狀態(tài)碼: 200 表7 響應(yīng)Body參數(shù) 參數(shù) 參數(shù)類型 描述 dataset_id String 數(shù)據(jù)集ID。 請求示例 更新數(shù)據(jù)集 { "description" : "just a
求求大佬們教教我,PCB的數(shù)據(jù)集咋弄阿。感覺我的模型沒問題的。
選擇企業(yè)項目。 在控制臺上方單擊“項目”后,單擊項目名稱,進入項目頁面。 單擊“數(shù)據(jù)管理 > 數(shù)據(jù)集”,進入數(shù)據(jù)集頁面。 單擊數(shù)據(jù)集名稱,進入數(shù)據(jù)集編輯頁面。 由自定義SQL創(chuàng)建的數(shù)據(jù)集,數(shù)據(jù)集名稱后會有“SQL”字樣。 單擊“SQL編輯”,進入SQL編輯頁面,對SQL語句進行編輯修改。
詳情頁面中,直接添加數(shù)據(jù),用于數(shù)據(jù)標(biāo)注。在標(biāo)注作業(yè)詳情頁面,單擊“未標(biāo)注”頁簽,然后單擊左上角“添加數(shù)據(jù)”。在彈出的導(dǎo)入對話框中,選擇數(shù)據(jù)來源、導(dǎo)入方式、導(dǎo)入路徑等參數(shù),導(dǎo)入數(shù)據(jù)。單擊確定。導(dǎo)入數(shù)據(jù)的詳細(xì)操作介紹請參見數(shù)據(jù)接入簡介圖2 導(dǎo)入數(shù)據(jù)刪除音頻通過數(shù)據(jù)刪除操作,可將需要丟
查看數(shù)據(jù)集成任務(wù) 概述 數(shù)據(jù)集成任務(wù)創(chuàng)建后,您可以查看任務(wù)的相關(guān)信息,包括任務(wù)的配置信息、運行日志、操作日志和調(diào)度日志等。 您也可以修改任務(wù)的配置,修改任務(wù)的操作跟創(chuàng)建任務(wù)類似,具體配置說明可參見創(chuàng)建數(shù)據(jù)集成任務(wù)。 請謹(jǐn)慎修改您的任務(wù)配置信息,避免目標(biāo)端出現(xiàn)臟數(shù)據(jù)或者數(shù)據(jù)集成不完
數(shù)據(jù)集,又稱為資料集、數(shù)據(jù)集合或資料集合,是指一種由數(shù)據(jù)所組成的集合。Data set,dataset是一個數(shù)據(jù)的集合,通常以表格形式出現(xiàn)。每一列代表一個特定變量。每一行都對應(yīng)于某一成員的數(shù)據(jù)集的問題。它列出的價值觀為每一個變量,如身高和體重的一個物體或價值的隨機數(shù)。每個數(shù)值被稱
數(shù)據(jù)集成指導(dǎo) 業(yè)務(wù)使用介紹 接入數(shù)據(jù)源 創(chuàng)建數(shù)據(jù)集成任務(wù)(普通任務(wù)) 創(chuàng)建數(shù)據(jù)集成任務(wù)(組合任務(wù)) 創(chuàng)建數(shù)據(jù)集成任務(wù)(編排任務(wù)) 啟停數(shù)據(jù)集成任務(wù) 數(shù)據(jù)集成任務(wù)管理 連接器
全部”。 在數(shù)據(jù)集管理頁面,單擊“新建數(shù)據(jù)集”。 在新增數(shù)據(jù)集頁面,設(shè)置數(shù)據(jù)集名稱、選擇數(shù)據(jù)類型、數(shù)據(jù)源和目錄,單擊“保存”。 圖5 新建DLI數(shù)據(jù)集 數(shù)據(jù)集名稱:新建數(shù)據(jù)集的名稱,用于標(biāo)識該數(shù)據(jù)集。長度為1~60個字符,可包括中文、字母、數(shù)字及下劃線。 數(shù)據(jù)類型:選擇“DLI”。
論。IMDB數(shù)據(jù)集是由斯坦福大學(xué)研究院整理的一套用于情感分析的IMDB電影評論二分類數(shù)據(jù)集,包含25000個訓(xùn)練樣本和25000個測試樣本,所有影評都被標(biāo)記為正面或負(fù)面兩種評價。IMDB數(shù)據(jù)集在TF中的讀取方法與MNIST等數(shù)據(jù)集較為類似。WikiText英語詞庫數(shù)據(jù)(The WikiText
新建數(shù)據(jù)集”,進入新建數(shù)據(jù)集頁面。 雙擊或者拖拽數(shù)據(jù)表,數(shù)據(jù)表被成功添加至操作面板。 單擊數(shù)據(jù)預(yù)覽區(qū)域的“刷新預(yù)覽”,即可查看數(shù)據(jù)表的數(shù)據(jù)。 單擊數(shù)據(jù)表的,選擇需要呈現(xiàn)的字段,如需關(guān)聯(lián)其他數(shù)據(jù)表,請參見多表級聯(lián)建模。 圖1 字段選擇 輸入數(shù)據(jù)集名稱,單擊“保存”完成數(shù)據(jù)集創(chuàng)建。 字段配置
分享數(shù)據(jù)集 DataArts Insight支持將數(shù)據(jù)集分享給其他的用戶/用戶組,被分享的用戶/用戶組將獲得對數(shù)據(jù)集的編輯和使用權(quán)限。本文介紹如何分享數(shù)據(jù)集,以便團隊成員可以快速開展協(xié)作。 前提條件 已接入數(shù)據(jù)源,請參見創(chuàng)建數(shù)據(jù)源。 已創(chuàng)建數(shù)據(jù)集,請參見創(chuàng)建數(shù)據(jù)集。 已開啟數(shù)據(jù)源分
各個主題域中管理的對象,選擇業(yè)務(wù)對象,篩選與對應(yīng)業(yè)務(wù)對象相關(guān)的數(shù)據(jù)集。 容器 容器在應(yīng)用元模型中與數(shù)據(jù)集相關(guān)聯(lián),選擇容器,篩選與對應(yīng)容器相關(guān)的數(shù)據(jù)集。 數(shù)據(jù)平臺實例 數(shù)據(jù)平臺實例在應(yīng)用元模型中與數(shù)據(jù)集相關(guān)聯(lián),選擇數(shù)據(jù)平臺實例,篩選與對應(yīng)數(shù)據(jù)平臺實例相關(guān)的數(shù)據(jù)集。 在“②選擇數(shù)據(jù)集”中,可通過關(guān)鍵字檢索、選擇標(biāo)注