華為云語(yǔ)音語(yǔ)義創(chuàng)新Lab在中文NL2SQL榜單CSpider榮登榜首
日前,華為云在NL2SQL領(lǐng)域取得了重大進(jìn)展?;谠谧匀徽Z(yǔ)言處理領(lǐng)域的深厚積累,華為云語(yǔ)音語(yǔ)義創(chuàng)新 Lab 聯(lián)合華為泊松實(shí)驗(yàn)室在CSpider榜單上榮登榜首,在主辦方給出的驗(yàn)證集和測(cè)試集上均達(dá)到第一,其中驗(yàn)證集比第二名高4.8%,測(cè)試集比第二名高1.9%。

CSpider最新榜單(截至2022年1月5日)
數(shù)據(jù)庫(kù)是企業(yè)存儲(chǔ)數(shù)據(jù)和知識(shí)的最主要手段,如何從數(shù)據(jù)庫(kù)的海量表格中檢索信息和處理數(shù)據(jù)一直是企業(yè)數(shù)字化和智能化的痛點(diǎn)之一。為了解決這個(gè)問(wèn)題,NL2SQL技術(shù)應(yīng)運(yùn)而生,該技術(shù)旨在將自然語(yǔ)言形式的查詢(xún)語(yǔ)句轉(zhuǎn)譯為SQL查詢(xún)語(yǔ)句,能夠降低數(shù)據(jù)庫(kù)使用門(mén)檻,提升企業(yè)人員查詢(xún)和處理數(shù)據(jù)庫(kù)表格數(shù)據(jù)的效率。
CSipder是由西湖大學(xué)在EMNLP2019上提出的一個(gè)中文NL2SQL的數(shù)據(jù)集,是中文NL2SQL的權(quán)威榜單,吸引了包括阿里在內(nèi)的國(guó)內(nèi)外友商參與。該數(shù)據(jù)集包含了10181個(gè)問(wèn)題和5693個(gè)SQL語(yǔ)句,涉及200個(gè)數(shù)據(jù)庫(kù),涵蓋了138個(gè)不同的領(lǐng)域。CSipder數(shù)據(jù)集是Spider數(shù)據(jù)集的中文版本,比Spider數(shù)據(jù)集更貼近中文實(shí)戰(zhàn)場(chǎng)景,因此更具挑戰(zhàn)性。
隨時(shí)獲取華為云AI最新動(dòng)態(tài),歡迎關(guān)注華為云AI公眾號(hào):
