AI能看懂英文,阿里巴巴奪實(shí)體發(fā)現(xiàn)測(cè)評(píng)全球第一
2017-11-27 09:18:32 來(lái)源:雷鋒網(wǎng) 熱度:
全球頂級(jí)的知識(shí)庫(kù)構(gòu)建測(cè)評(píng)KBP2017日期公布了最新排名。阿里巴巴人工智能研究機(jī)構(gòu)iDST斬獲英文實(shí)體發(fā)現(xiàn)測(cè)評(píng)全球冠軍,在準(zhǔn)確率和召回率上均表現(xiàn)出色,核心指標(biāo)F1達(dá)到0.811。這次測(cè)評(píng)吸引了全球20多支頂尖團(tuán)隊(duì)參與,包括IBM Research, BBN, Stanford Univ, CMU Univ, UIUC Univ, Columbia Univ, 騰訊等。
KBP是由NIST(National Institute of Standards and Technology,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院)指導(dǎo)、美國(guó)國(guó)防部協(xié)辦的賽事,主要任務(wù)為從自然書寫的非結(jié)構(gòu)化文本中抽取實(shí)體,以及實(shí)體之間的關(guān)系。

這項(xiàng)測(cè)評(píng)要求AI算法在“讀完”一篇英文文章后,構(gòu)建一個(gè)物理世界的命名實(shí)體和實(shí)體之間關(guān)系的知識(shí)庫(kù),如“克林頓和希拉里之間是夫妻關(guān)系”、“克林頓畢業(yè)于耶魯法學(xué)院”這樣一個(gè)個(gè)實(shí)體的關(guān)系。
阿里巴巴iDST自然語(yǔ)言處理首席科學(xué)家司羅介紹,他們的算法可以做到對(duì)文章上下文的理解。比如,文章出現(xiàn)了Apple,再出現(xiàn)Jobs,就可以辨別出這個(gè)Jobs指的是喬布斯,而不是工作。再比如,文章出現(xiàn)了Microsoft,那么Apple就更有可能是蘋果公司,而不是一種水果。
“另外,我們構(gòu)建了一個(gè)算法去學(xué)習(xí)不同領(lǐng)域之間共同的部分,通過(guò)遷移學(xué)習(xí)提升我們學(xué)習(xí)的準(zhǔn)確度。對(duì)于不同領(lǐng)域數(shù)據(jù),我們?nèi)∑渚A,去其糟粕,進(jìn)行智能學(xué)習(xí)”,司羅說(shuō)。
在這次測(cè)評(píng)中,iDST團(tuán)隊(duì)采用經(jīng)過(guò)改良的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)對(duì)文本進(jìn)行理解。改良的架構(gòu)有三個(gè)主要特點(diǎn):首先該模型可以自動(dòng)閱讀海量文章(如維基百科)并從中汲取經(jīng)驗(yàn);其次,該架構(gòu)可以智能選擇訓(xùn)練數(shù)據(jù)集以保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性;最后,我們采用post regularization的辦法保證模型結(jié)果的一致性。
對(duì)于KBP2017的成績(jī),司羅表示:“很榮幸能夠同全球的同行分享阿里巴巴的研究成果,人工智能在機(jī)器閱讀理解和知識(shí)庫(kù)構(gòu)建上還處在起步階段,我們正在積極和同行業(yè)頂尖機(jī)構(gòu)學(xué)習(xí)交流,推動(dòng)行業(yè)發(fā)展。比如我們內(nèi)部建設(shè)的信息抽取平臺(tái)AliIE項(xiàng)目就在同斯坦福大學(xué)展開(kāi)積極合作”。
阿里巴巴正在將這樣的信息抽取技術(shù)廣泛的應(yīng)用到實(shí)際業(yè)務(wù)當(dāng)中,并致力于讓更多的中小開(kāi)發(fā)者從中收益。他們搭建的信息抽取平臺(tái)AliIE擁有最頂尖的AI技術(shù),并從一開(kāi)始的架構(gòu)設(shè)計(jì)就考慮到平臺(tái)的開(kāi)放性和可擴(kuò)展性。可以讓更多的開(kāi)發(fā)者、研究員共同開(kāi)發(fā),并將成果回饋給這個(gè)社區(qū)。

阿里巴巴iDST自然語(yǔ)言處理首席科學(xué)家司羅
司羅是全球權(quán)威機(jī)器智能學(xué)者,曾擔(dān)任美國(guó)普渡大學(xué)計(jì)算機(jī)系終身教授,主持的20余個(gè)項(xiàng)目得到美國(guó)政府、工業(yè)界資助,先后獲得美國(guó)國(guó)家科學(xué)基金會(huì)成就獎(jiǎng)、雅虎、谷歌研究獎(jiǎng)等。
由他領(lǐng)導(dǎo)的自然語(yǔ)言處理團(tuán)隊(duì)目前支持了阿里巴巴大生態(tài)每天多達(dá)600億次的自然語(yǔ)言處理需求,團(tuán)隊(duì)橫跨杭州、北京、硅谷、西雅圖(新加坡)多地,成員大多擁有10年以上的研發(fā)經(jīng)驗(yàn)。檢索招聘網(wǎng)站可以看到,他們依舊在不斷擴(kuò)充團(tuán)隊(duì)。
下一篇:別再拿人類智能當(dāng)做AI目標(biāo):數(shù)據(jù)與AI能共生上一篇:IEEE發(fā)布三項(xiàng)人工智能新標(biāo)準(zhǔn) 將優(yōu)先考慮人類
責(zé)任編輯:黃焱林
相關(guān)推薦
阿里巴巴再次調(diào)整架構(gòu):對(duì)移動(dòng)端重視度大幅提升
阿里巴巴集團(tuán)昨日晚間宣布架構(gòu)調(diào)整,加強(qiáng)在移動(dòng)互聯(lián)網(wǎng)領(lǐng)域的深入布局,由阿里巴巴新任CEO陸兆禧親自掛帥移動(dòng)業(yè)務(wù)。同時(shí),原B2C事業(yè)群總裁張勇出任阿里巴巴集團(tuán)COO。此次架構(gòu)調(diào)整主要涉及兩大業(yè)務(wù),一是新成立網(wǎng)絡(luò)通訊事業(yè)部,由原來(lái)的旺信業(yè)務(wù)和來(lái)往業(yè)務(wù)組成。二是阿里巴巴宣布將OS事業(yè)部升級(jí)為OS事業(yè)群,下轄OS手機(jī)事業(yè)部和OS家庭智能娛樂(lè)事業(yè)部。阿里巴...