華為云語音語義創(chuàng)新Lab奪得CCL中文AMR語義解析評測任務冠軍
華為云語音語義創(chuàng)新Lab奪得CCL中文AMR語義解析評測任務冠軍
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經(jīng)理
活動時間: 2020年8月12日-2020年9月11日
活動期間,華為云用戶通過活動頁面購買云服務,或使用上云禮包優(yōu)惠券在華為云官網(wǎng)新購云服務,累計新購實付付費金額達到一定額度,可兌換相應的實物禮品?;顒觾?yōu)惠券可在本活動頁面中“上云禮包”等方式獲取,在華為云官網(wǎng)直接購買(未使用年中云鉅惠活動優(yōu)惠券)或參與其他活動的訂單付費金額不計入統(tǒng)計范圍內;
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經(jīng)理
抽象語義表示(Abstract Meaning Representation, AMR)是一種領域無關的、通用的整句語義表示方法,它使用單根有向無環(huán)圖來表示一個句子的語義結構。作為一種深層的語義表示方法,AMR能夠有效挖掘句子的語義信息,并提升很多自然語言處理下游任務的性能,比如機器翻譯、文本摘要、信息抽取等。和英文AMR相比,中文抽象語義表示(Chinese AMR, CAMR)增加了概念關系對齊信息,并針對中文特點增加了一些語義標簽。
本次CAMR評測比賽依托第二十一屆中國計算語言學大會CCL-2022。CCL是中國中文信息學會(CIPS)的重要會議,是中國最大的自然語言處理學者和專家的社區(qū)。經(jīng)過三十年的發(fā)展,CCL被廣泛認為是最權威的,全國最具影響力、規(guī)模最大的NLP會議。華為云語音語義創(chuàng)新Lab和蘇州大學組成的聯(lián)合團隊在“中文抽象語義表示解析”評測任務中獲得第一名的佳績。本次評測共有testa和testb兩個測試數(shù)據(jù)集,并分為closed和open兩個賽道,我們在兩個賽道、兩個測試集上均取得了第一名的成績。詳細的信息請查看評測網(wǎng)址:https://github.com/GoThereGit/Chinese-AMR

CAMR評測任務的難點在于,AMR圖中的概念節(jié)點和句子中詞并不是一一對應的關系,有的概念節(jié)點由單個詞組成,有的概念節(jié)點只由一個詞當中的幾個字組成,有的概念節(jié)點是由多個詞組成,有的概念節(jié)點甚至并不存于句子中,例如下圖中的節(jié)點“temporal-quantity”。AMR的這種特性決定了我們不能直接采用傳統(tǒng)的基于圖的方法解決。

為了處理這個問題,我們嘗試了一系列最新的自然語言處理技術,最終決定采用非自回歸的方法首先生成AMR圖中的概念節(jié)點,然后對這些節(jié)點進行邊的建立、從而生成最終的AMR語義圖。為了進一步提升模型的性能,我們還采用了多圖聚合的ensemble策略。在實驗中,我們還發(fā)現(xiàn)句子的句法結構能夠有效提升CAMR的性能。結合這些先進的技術,我們最終取得了評測任務第一名的成績。
語義分析是自然語言處理的一個核心任務,也是人工智能的一個重要的組成部分。華為云語音語義創(chuàng)新Lab在人工智能語音語義領域深耕技術,接連奪得包括DiggScience科學數(shù)據(jù)挖掘,NLPCC預訓練模型,CCF BDCI金融實體情感分析,WSDM網(wǎng)絡搜索與數(shù)據(jù)挖掘在內的多項國際國內頂賽冠軍。憑借先進的NLP技術,華為云提供了多個高效的場景應用、極大地提升了客戶的工作效率。
隨時獲取華為云AI最新動態(tài),歡迎關注華為云AI公眾號:
隨時獲取華為云AI最新動態(tài),歡迎關注華為云AI公眾號:
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經(jīng)理
活動時間: 2020年8月12日-2020年9月11日
活動期間,華為云用戶通過活動頁面購買云服務,或使用上云禮包優(yōu)惠券在華為云官網(wǎng)新購云服務,累計新購實付付費金額達到一定額度,可兌換相應的實物禮品?;顒觾?yōu)惠券可在本活動頁面中“上云禮包”等方式獲取,在華為云官網(wǎng)直接購買(未使用年中云鉅惠活動優(yōu)惠券)或參與其他活動的訂單付費金額不計入統(tǒng)計范圍內;
活動對象:華為云電銷客戶及渠道伙伴客戶可參與消費滿送活動,其他客戶參與前請咨詢客戶經(jīng)理
