文本分類應(yīng)用案例全面介紹
1. 基本概念
為什么:文字是人類傳遞信息的最大的載體,文字存在于各個(gè)角落,如互聯(lián)網(wǎng)、法律文書、聊天記錄、社交媒體、案件記錄、短息、郵件等等。如何從海量文本中挖掘出有價(jià)值的信息?如自動(dòng)識(shí)別某些類別的信息等。
是什么:文本分類從給定的標(biāo)簽集合中自動(dòng)地給文本打標(biāo)簽,其應(yīng)用非常廣泛,舉例如下:
2. 文本分類應(yīng)用場(chǎng)景
-
郵件自動(dòng)回復(fù):在跨境電商場(chǎng)景中,自動(dòng)識(shí)別用戶反饋的問(wèn)題的類別,如產(chǎn)品質(zhì)量問(wèn)題、快遞問(wèn)題、產(chǎn)品描述問(wèn)題等,并基于問(wèn)題類別自動(dòng)回復(fù)內(nèi)容。
-
郵件自動(dòng)打標(biāo)簽:如自動(dòng)識(shí)別郵件是不是垃圾郵件。
-
12345咨詢自動(dòng)分撥:在政務(wù)場(chǎng)景中,自動(dòng)識(shí)別用戶反饋的問(wèn)題類別,如環(huán)境污染、水污染、噪聲問(wèn)題、道路擁堵問(wèn)題等,并基于問(wèn)題類別自動(dòng)分配到對(duì)應(yīng)的處理部門進(jìn)行處理。
-
稅種類別自動(dòng)識(shí)別:根據(jù)經(jīng)營(yíng)范圍,自動(dòng)識(shí)別該經(jīng)營(yíng)范圍需要交哪些稅種,如增值稅、個(gè)人所得稅等。
-
商品正負(fù)面評(píng)論識(shí)別:自動(dòng)識(shí)別用戶對(duì)商品的評(píng)論是正面評(píng)論還是負(fù)面評(píng)論。
-
內(nèi)容審核之廣告檢測(cè):檢測(cè)是不是廣告。
-
內(nèi)容審核之灌水評(píng)論檢測(cè):檢測(cè)評(píng)論是否是灌水評(píng)論。
-
內(nèi)容審核之涉政涉黃言論檢測(cè):自動(dòng)判斷一段文本是否涉政或涉黃。
-
辱罵評(píng)論識(shí)別:自動(dòng)判斷一段文本是否涉及辱罵、種族歧視等。
-
購(gòu)買意愿識(shí)別:根據(jù)用戶發(fā)表的微博等信息判斷是否有購(gòu)買某商品的意愿。
-
稅務(wù)問(wèn)題分類:根據(jù)用戶咨詢的問(wèn)題識(shí)別是哪一類問(wèn)題,如APP問(wèn)題、網(wǎng)站問(wèn)題等。
-
客服/聊天話題分類:自動(dòng)識(shí)別客服跟用戶聊天過(guò)程中用戶反饋的問(wèn)題類別,如是退貨問(wèn)題、物流問(wèn)題、商品質(zhì)量問(wèn)題等。
-
客服聊天情感分析:根據(jù)用戶和客服聊天的內(nèi)容進(jìn)行情感分析,判斷用戶和客戶的情感態(tài)度,其結(jié)果可以作為客服服務(wù)之間評(píng)估的維度之一。
-
案件描述分類:根據(jù)民警的案件錄入信息,自動(dòng)判斷案件是什么類型的案件,如短信詐騙、網(wǎng)絡(luò)詐騙、熟人詐騙等。
-
自殺傾向預(yù)測(cè):根據(jù)用戶的社交媒體發(fā)布的信息,自動(dòng)識(shí)別用戶是否有抑郁或自殺傾向等。
-
欺詐短信識(shí)別:自動(dòng)判斷發(fā)過(guò)來(lái)的短信是否是詐騙短信。
-
新聞分類:自動(dòng)判斷新聞?lì)悇e,如政治類、經(jīng)濟(jì)類、民生類、體育類等。
-
事件類型分類:自動(dòng)判斷事件的類型,如金融領(lǐng)域的新聞報(bào)道中涉及到的事件類別自動(dòng)識(shí)別:聘任、辭職、增持、減持、會(huì)議召開。
......
歡迎大家基于以上例子為參考,給我們提出新的需求,方式如下:
1) 在下方直接留言討論,并留下聯(lián)系方式
2) 直接通過(guò)郵箱聯(lián)系戚經(jīng)理:qijianghui@huawei.com
隨時(shí)獲取華為云AI最新動(dòng)態(tài),歡迎關(guān)注華為云AI公眾號(hào):