欧美色图 亚洲|野外口爆视频国产|久久精品视频观看|97精品人人抽插

AI完爆人類?一文讀懂AlphaGo Zero的偉大與局限

2017-10-23 11:07:51 來源:雷鋒網(wǎng) 熱度:
雷鋒網(wǎng)AI科技評論按:每次AI領域有重大突破時,甚囂塵上的“AI威脅論”必然會卷土重來。
 
2017年10月19日,DeepMind團隊重磅發(fā)布AlphaGo Zero,再次震驚世人。相比上一代AlphaGo,該版本的AlphaGo實現(xiàn)了在AI發(fā)展中非常有意義的一步——”無師自通“,這也讓去年敗在未升級版本AlphaGo Master下的中國棋手柯潔驚呼”人類太多余了“。
 
相信看過之前的報道都知道,AlphaGo Zero的先進之處是可以完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,完全靠自己通過強化學習
(Reinforcement Learning ),左右互搏來增長棋藝,最終達到百戰(zhàn)百勝。
 
那是不是就代表AI從此將進入到無需人類知識,不受人類控制的時代?顯然還達不到。
 
要想理解為什么,首先從圍棋這個游戲說起。圍棋是一種對弈游戲,具體來說就是信息透明,規(guī)則透明,結構明確,并且可用規(guī)則是可以窮舉的。而如果到了一些數(shù)據(jù)無法窮舉的領域,如語音識別,圖像識別,自動駕駛等,AlphaGo Zero中的算法很難遷移過來,也很難“無師自通”。
 
那AlphaGo Zero中的算法可以借鑒到哪些領域?他的核心技術是什么?他的偉大之處又是在哪里?這還得請AI科學家來談一談。AI科技評論得知,此版本的AlphaGo所采用的核心技術就是出自華人團隊研究的深度殘差網(wǎng)絡(ResNet)。就此背景,雷鋒網(wǎng)聯(lián)系到了深度殘差網(wǎng)絡ResNet作者之一孫劍博士來對這次的技術升級做闡述。ResNet技術正是他在微軟亞洲研究院時期的發(fā)明。
 
 
曠視首席科學家,曠視研究院院長孫劍博士
 
在他看來,本次技術提升足夠偉大,但同樣在真實技術落地過程中有著眾多局限,并指出未來的主流深度學習技術還將會圍繞大數(shù)據(jù)訓練模式的方式。換句話說,AI想脫離人類控制還為時尚早。
 
孫劍博士在接受雷鋒網(wǎng)的采訪過程中說道:“AlphaGo Zero的偉大之處是第一次讓機器可以不通過任何棋譜,不通過任何人類的經(jīng)驗,在只告訴規(guī)則的前提下就實現(xiàn)了成為一個圍棋高手,這種無師自通的學習模式在AI整個發(fā)展上是非常有里程碑意義的。”孫劍博士講到AlphaGo Zero的技術意義時講到,“但是同時這種無師自通在很多AI落地上也存在一些局限,因為嚴格的講,圍棋規(guī)則和判定棋局輸贏也是一種監(jiān)督信號,所以嚴格意義上來講,說人類無用,或者說機器可以自己產(chǎn)生認知都是對AlphaGo Zero理解的不精確。”
 
在很多AI行業(yè)落地中,實際上弱監(jiān)督學習或無監(jiān)督或者所謂的無師自通還是無法在短期成為主流。比如,就人臉識別來講,這個能力是人類后天學習的能力,是通過時間不斷演化出來的一種生存能力,人只有具備了人臉識別能力,人類社會才能正常運轉,把這種后天能力輸出給機器,其實就需要人的監(jiān)督信號。除了人臉識別,還有很多人工智能研究的方向,比如自然語言處理,都是在模擬人類的一種技能。讓機器實現(xiàn)這種任務就需要海量的數(shù)據(jù)與更多的信號輸入。再比如醫(yī)學領域的圖像識別—AI醫(yī)學影像讀圖主要依賴于高水平醫(yī)生對影像的數(shù)據(jù)精標,從而機器學習對疾病的識別,這關乎于人的生命問題,自然馬虎不得。所以今天,甚至今后很長一段時間內,監(jiān)督學習依然是AI研究與AI商業(yè)化的主流方向。
 
關于AlphaGo Zero中的算法可以借鑒到哪些領域?孫劍博士沒有直接給出答案,而是總結了此算法為何能在圍棋領域表現(xiàn)如此出色的幾點原因。首先,圍棋它沒有噪聲,能夠完美重現(xiàn)算法;其次圍棋中的黑白子雙方的信息是完全可觀測的。最后,也是他認為最重要的一點,圍棋對局可以用計算機迅速模擬,很快輸出輸贏信號。看一個領域是否能借鑒此算法,基本就要看是否滿足以上三點。
 
AlphaGo的秘密武器:兩大核心要素實現(xiàn)極簡算法
 
其實AlphaGo Zero里面并沒有新的巨大的理論突破,它使用的白板學習,早在之前的圍棋系統(tǒng)Creazy Stone中就有用過。最主要還是用到了孫劍博士發(fā)明的ResNet技術, 談到該技術時,他講到: ”AlphaGo Zero的搜索過程簡化了很多,例如把以前系統(tǒng)中的兩個網(wǎng)絡合并成一個網(wǎng)絡、將深度殘差網(wǎng)絡的輸入做最簡化。談到本次AlphaGo Zero在技術特點,他認為是“把19x19棋局圖像直接送給神經(jīng)網(wǎng)絡,讓神經(jīng)網(wǎng)絡看著棋盤做決策,這個非常簡潔。”
 
AI科技評論認為DeepMind的這一成果的啟發(fā)意義大于借鑒意義。與其想著把算法照搬過來,不如朝AlphaGo Zero啟發(fā)的方向探索。在與孫劍博士在采訪交流中,他表示本次AlphaGo Zero的提升主要有兩個核心要素,一個是啟發(fā)式搜索,一個是深度殘差神經(jīng)網(wǎng)絡,而這兩個又非常完美的實現(xiàn)了結合。其中啟發(fā)式搜索的思想非常樸素,是個針對問題設計的一個高級定制版蒙特卡洛數(shù)搜索算法。另外一個核心要素是深度殘差神經(jīng)網(wǎng)絡,讓簡單的搜索算法極大的提升了效率。
 
深度殘差神經(jīng)網(wǎng)絡在2015年由孫劍在微軟領導的視覺團隊老師率先提出,并在當年在ImageNet以及COCO兩大學術競賽中包攬五項冠軍,其中最重要的部分就是實現(xiàn)了突破性的152層的網(wǎng)絡深度,從而讓一些非常復雜的函數(shù)做映射時效率與有效性得到極大的提升。強大的網(wǎng)絡使得AlphaGo Zero已經(jīng)可以有能力學習把每一子下在那里的概率和對整個棋局的判斷算的非常準確。
 
開放與互通是AI通往未來之路的不二法則
 
今年,中國發(fā)布了人工智能戰(zhàn)略規(guī)劃,起碼從國家層面上是認可AI能給社會帶來巨大進步。在講到AI的未來發(fā)展中,孫劍博士強調了開放與互通兩個詞。他講到他現(xiàn)在在曠視研究院每天第一件事情就是去網(wǎng)上開放的論文平臺ArXiv看是否有新的、有意思的論文、思想發(fā)出來。
 
最后雷鋒網(wǎng)問道,ResNet被應用到AlphaGo Zero上,您有什么感受?孫劍博士表示:“這次應用在AlphaGo Zero中的ResNet殘差神經(jīng)網(wǎng)絡,曾獲得了CVPR 2016的最佳論文獎,我也非常高興這個技術可以應用在AlphaGo Zero系統(tǒng)中,而這個應用過程其實并不需要我們直接進行接觸而是一種研究成果的交流,人工智能研究最前沿的開源與開放,才能讓我們在追求更優(yōu)解的過程中有很多參考與理論支撐,可以極大的提升新技術產(chǎn)生的周期。”
 
孫劍博士還介紹到,曠視研究院今后還會不斷分享、開放研究成果。今年7月份,曠視研究院在ArXiv公開了一篇ShuffleNet的論文,是一種可以運行在很多移動端上非常低能耗的神經(jīng)網(wǎng)絡算法,可以說是專為移動端而生的算法。發(fā)布至今不光有硬件產(chǎn)品、手機解鎖產(chǎn)品使用,同時也有很多同行在使用。
 
雷鋒網(wǎng)AI科技評論小結:AlphaGo Zero雖沒有新的突破性的技術,但這絲毫不影響它的偉大,它能夠完美集成已有的技術,給研究者帶來新的啟發(fā),本身已具有里程碑式的意義。他的局限在于目前只能運用到特定領域,不過,換個角度來看,這對于人類來說未必不是好事兒??傊?,AI還有很長的路要走,還需要更多像孫劍博士這樣的科學家們,不斷借助創(chuàng)新而實現(xiàn)更多的創(chuàng)新,不斷借助偉大的思想創(chuàng)造偉大的場景。只有不斷的開放最好的認知,才能讓AI不斷成長,讓更多更強的AlphaGo Zero產(chǎn)生。

責任編輯:黃焱林

相關推薦

Telairity H.264 編碼技術為2010年世界杯全球高清/標清轉播提供支持

DVBCN消息2010年7月7日電--Telairity卓越的H.264編碼技術是為全球近十億人觀看2010年世界杯足球賽提供支持的“秘密要素”。整個亞洲、南太平洋以及世界杯主辦國南非的觀眾都是依靠Telairity的H.264/AVC編碼器來收看高清(HD)和標清(SD)比賽轉播的。有了Telairity的H.264現(xiàn)代技術,世界各地的網(wǎng)絡運營商和廣播、衛(wèi)星及有線電視公司可以更換掉舊的MPEG-2壓縮系統(tǒng),為客戶提供更出色的視頻質量并顯著降低對帶寬的依賴,從而大幅減少傳輸成本。泰國國營電信公司CATTelecomPublicCompanyLimited安裝了Telairity高清和標清編碼器

ST高清電視系統(tǒng)級芯片獲Adobe AIR for TV認證

意法半導體(STMicroelectronics,簡稱ST)宣布,其先進的高清電視系統(tǒng)級芯片(SoC)平臺取得了巨大進步,此項成果將意法半導體推向能夠運行基于Adobe®AIR®的游戲和其它應用軟件的下一代互聯(lián)網(wǎng)電視技術的最前沿。意法半導體已成功移植AdobeAIR®2.5forTV軟件至第三代先進互動高清機頂盒系統(tǒng)芯片平臺,并通過Adobe產(chǎn)品認證。AdobeAIR軟件是AdobeFlash平臺的一個重要組件,原始設備制造商(OEM)、原始設計制造商(ODM)、服務開發(fā)人員以及應用開發(fā)人員能夠在這個平臺開發(fā)豐富的網(wǎng)絡應用軟件和游戲,專門為機頂盒和數(shù)字電視等嵌入式設備和

把面向數(shù)字家庭的Adobe Flash引進到MIPS-Based平臺

TriplePlayIntegration銷售副總裁MikeNottage什么是三重播放集成?TPI公司是一家致力于提供數(shù)字家庭視頻平臺解決方案的專業(yè)軟件服務公司。TPI公司還是官方Adobe的“ScalingPartner”,為消費電子平臺提供FlashPlayer10、AIR和舞臺美術技術提供優(yōu)化的端口。我們有25名具有專業(yè)的項目管理和質量保障經(jīng)驗的高級工程師團隊,平均具有24年的工作經(jīng)驗.你們能夠提供什么樣的

Alan Tsai:移動終端GPU之趨勢與迷思

DVBCN數(shù)字電視中文網(wǎng)訊(敖瑞),2012年6月15日(周五),由ARM主辦的“跨界、變革、多贏——ARM移動智能終端研討會暨應用開發(fā)者大會”在上海舉行。本次約有20名廠商代表上臺演講;參會并參與展示會的廠商超過30家,均為ARM在各個領域的合作伙伴。ARM亞太市場開發(fā)經(jīng)理AlanTsai做出了“移動終端GPU之趨勢與迷思”的精彩演講。Alan表示:在用戶體驗上來說,分辨率已經(jīng)可以高達人眼都無法辨析的地步了。公允的說,業(yè)界對GPU的評判標準存在太多的分歧:從三角形的角度來看,涉及到生成率、裁切率等指標,不同類型的GPU產(chǎn)品根本沒法比;從填充率的角度上