檢測到您已登錄華為云國際站賬號,為了您更好的體驗,建議您訪問國際站服務網站 http://m.cqfng.cn/intl/zh-cn
不再顯示此消息
1、什么是pkuseg pkuseg 是由北京大學語言計算與機器學習研究組研制推出的一套全新的中文分詞工具包。github地址: https://github.com/lancopku/pkuseg-python 2、特點 多領域分詞。不同于以往的通用中文分詞工具,此工具包同時致力于為不同領域的數據提供個性化的預訓練模型
該API屬于CSS服務,描述: 該接口用于刪除自定義詞庫。接口URL: "/v1.0/{project_id}/clusters/{cluster_id}/poisson_words"
刪除敏感詞 場景描述 刪除敏感詞的接口。
新增敏感詞 場景描述 新增敏感詞的接口。
刪除敏感詞分類 場景描述 刪除敏感詞分類的接口。
創(chuàng)建敏感詞分類 場景描述 創(chuàng)建敏感詞分類的接口。
更新敏感詞分類 場景描述 更新敏感詞分類的接口。
識別文本內容是否有敏感內容,事件類型為評論,命中的自定義詞庫名稱為custom_xxx,檢測時使用的自定義白名單詞庫列表為custom_xxx,檢測文本為asdfasdfasdf。
3、敏感關鍵詞庫 對于一個站點而言,無論是論壇還是獨立博客,它都需要過濾一些違禁關鍵詞,特別是博客評論的內容,否則很可能被監(jiān)管機構查封與搜索引擎降權,這往往得不償失。
我們的音頻敏感詞定位使用深度學習 和深度神經網絡技術,所以從神經網絡開 始介紹。神經網絡最早也是模擬生物學對 大腦的研究。有一個諾貝爾生物學獎成果: 一個神經元的細胞只能處理、理解大圖片的一角,而不是完整的大圖片,很多神經 元分層連接組成了現在叫做特征的神經網 絡。
根據敏感詞分類的唯一標識取得分類下敏感詞列表 場景描述 根據敏感詞分類的唯一標識取得分類下敏感詞列表的接口。
更新敏感詞 場景描述 更新敏感詞的接口。
取得敏感詞列表 場景描述 取得敏感詞列表的接口。
前提條件 已通過敏感數據識別任務,自動或手動將敏感數據同步到數據地圖組件,詳見發(fā)現敏感數據或查看敏感數據分布。
定義識別規(guī)則 定義敏感數據識別標準。 定義識別規(guī)則組 通過定義敏感數據識別規(guī)則及規(guī)則組,來有效識別數據庫內的敏感數據。 敏感數據發(fā)現 創(chuàng)建并運行敏感數據識別任務。 敏感數據分布 查看敏感數據識別任務識別出的敏感數據。 父主題: 敏感數據識別
獲取敏感詞分類列表 場景描述 取得敏感詞分類列表的接口。
添加敏感詞 操作步驟 選擇“配置中心>機器人管理>語義理解服務”菜單。 選擇“知識管理 > 實體管理”,單擊“敏感詞”頁簽。 單擊左側分類區(qū)域的,為敏感詞添加分類,例如“違禁詞”,單擊“保存”。 選中左側新增的分類,單擊右側的“新增”,添加敏感詞。您可以使用回車添加多條記錄。
配置敏感詞 選擇知識管理>實體管理>敏感詞。 單擊“新增”,創(chuàng)建一個敏感詞分類(根據實際情況可以配置多個敏感詞類型)。 單擊右側的“新增”,創(chuàng)建具體的敏感詞內容。例:當前創(chuàng)建了一個違禁語分類,在違禁語下創(chuàng)建了密碼作為違禁語。 父主題: 配置智能座席助手
更新敏感數據識別結果 功能介紹 根據指定的任務ID和項目ID,更新敏感數據分類識別結果。 調用方法 請參見如何調用API。
選擇左側導航欄的“敏感配置管理”。 單擊“敏感配置錄入”,配置相關參數。參數說明如表1所示。 敏感配置錄入后,管理臺不會明文顯示敏感配置的明文值,請務必妥善保存明文值。 表1 錄入敏感配置參數說明 參數 說明 推送實例 選擇在哪個環(huán)境下配置敏感配置項。