華為云語音語義創(chuàng)新Lab在中文NL2SQL榜單CSpider榮登榜首
日前,華為云在NL2SQL領(lǐng)域取得了重大進(jìn)展。基于在自然語言處理領(lǐng)域的深厚積累,華為云語音語義創(chuàng)新 Lab 聯(lián)合華為泊松實驗室在CSpider榜單上榮登榜首,在主辦方給出的驗證集和測試集上均達(dá)到第一,其中驗證集比第二名高4.8%,測試集比第二名高1.9%。
CSpider最新榜單(截至2022年1月5日)
數(shù)據(jù)庫是企業(yè)存儲數(shù)據(jù)和知識的最主要手段,如何從數(shù)據(jù)庫的海量表格中檢索信息和處理數(shù)據(jù)一直是企業(yè)數(shù)字化和智能化的痛點之一。為了解決這個問題,NL2SQL技術(shù)應(yīng)運而生,該技術(shù)旨在將自然語言形式的查詢語句轉(zhuǎn)譯為SQL查詢語句,能夠降低數(shù)據(jù)庫使用門檻,提升企業(yè)人員查詢和處理數(shù)據(jù)庫表格數(shù)據(jù)的效率。
CSipder是由西湖大學(xué)在EMNLP2019上提出的一個中文NL2SQL的數(shù)據(jù)集,是中文NL2SQL的權(quán)威榜單,吸引了包括阿里在內(nèi)的國內(nèi)外友商參與。該數(shù)據(jù)集包含了10181個問題和5693個SQL語句,涉及200個數(shù)據(jù)庫,涵蓋了138個不同的領(lǐng)域。CSipder數(shù)據(jù)集是Spider數(shù)據(jù)集的中文版本,比Spider數(shù)據(jù)集更貼近中文實戰(zhàn)場景,因此更具挑戰(zhàn)性。
隨時獲取華為云AI最新動態(tài),歡迎關(guān)注華為云AI公眾號: