該公司表示,這兩項(xiàng)工具可用來(lái)減少垃圾消息的數(shù)量,同時(shí)屏蔽內(nèi)容和視頻中的攻擊性評(píng)論。
自動(dòng)評(píng)論過(guò)濾器自去年9月就一直存在,用戶可以選擇自動(dòng)啟動(dòng)該程序。該程序可利用機(jī)器學(xué)習(xí)來(lái)識(shí)別可能引人反感的評(píng)論。如果在評(píng)論過(guò)濾器開(kāi)啟的情況下仍然出現(xiàn)攻擊性評(píng)論,那么用戶可以像以往一樣直接向Instagram報(bào)告。Instagram表示,評(píng)論過(guò)濾器目前僅支持英語(yǔ),不過(guò)未來(lái)將支持其他語(yǔ)言。
另一方面,垃圾消息過(guò)濾器自去年10月上線以來(lái)就一直處于對(duì)外界保密的狀態(tài)。而上線9月有余都未被用戶發(fā)現(xiàn),于 Instagram 而言已經(jīng)說(shuō)不準(zhǔn)是好事還是壞事。目前該功能可以自動(dòng)清除英語(yǔ)、西班牙語(yǔ)、葡萄牙語(yǔ)、阿拉伯語(yǔ)、法語(yǔ)、德語(yǔ)、俄語(yǔ)、日語(yǔ)和漢語(yǔ)共9種語(yǔ)言的垃圾消息。
雷鋒網(wǎng)了解到,F(xiàn)acebook于2012年以10億美元收購(gòu)了Instagram,并將其內(nèi)部技術(shù)遷移至Facebook的數(shù)據(jù)中心。
據(jù)報(bào)道,此次Instagram 發(fā)布的評(píng)論過(guò)濾器就是使用了Facebook 旗下AML實(shí)驗(yàn)室建立的“Deep Text”系統(tǒng)。在Facebook 上,其可以結(jié)合機(jī)器學(xué)習(xí)輔助器完成每日 40 億次以上的翻譯功能的處理。此外,該系統(tǒng)還能在一秒之內(nèi)理解超過(guò)二十多種語(yǔ)言的數(shù)千封郵件的內(nèi)容。
如此前雷鋒網(wǎng)報(bào)道的Facebook 在AI+廣告中的應(yīng)用和探索一文里,就詳細(xì)的介紹了這一文本系統(tǒng)對(duì) Feeds Ads的支持。
去年6月,Deep Text上線。其一開(kāi)始被定位為內(nèi)部工具,用來(lái)幫助Facebook 工程師快速排序大量文本,創(chuàng)建分類(lèi)規(guī)則。其后 Instagram 高管深入了解該系統(tǒng)之后,立即看到了機(jī)會(huì)——借其打擊垃圾郵件。因?yàn)閷?duì)于Instagram 的用戶來(lái)說(shuō),垃圾郵件幾乎是一個(gè)極其影響用戶體驗(yàn)的煩惱。
在決定使用該系統(tǒng)之后,Instagram 第一步就是聘請(qǐng)了一批人員對(duì)該平臺(tái)進(jìn)行評(píng)論,并將評(píng)論按照“垃圾郵件”和“非垃圾郵件”分類(lèi)。事實(shí)上,這種工作,在社交媒體涉及的技術(shù)行業(yè)而言非常普遍。先利用人類(lèi)來(lái)訓(xùn)練機(jī)器,讓其執(zhí)行單調(diào)甚至無(wú)聊的工作,如此反復(fù),最終機(jī)器會(huì)慢慢變得聰明和智能。
Instagram 相關(guān)負(fù)責(zé)人表示,最終通過(guò)不斷地?cái)?shù)據(jù)整合,有3/4的數(shù)據(jù)被送入 Deep Text?;诖耍琁nstagram 的工程師可創(chuàng)建算法,并對(duì)垃圾郵件可進(jìn)行正確的分類(lèi)。
在經(jīng)歷4個(gè)多月的不斷測(cè)試和研究后,Instagram 團(tuán)隊(duì)在去年10月悄悄地上線了垃圾郵件過(guò)濾的功能。Instagram 的CEO Kevin Systrom對(duì)該功能的效果感到十分滿意。他決定利用 Deep Text 來(lái)處理更復(fù)雜的問(wèn)題——消除與Instagram 社區(qū)準(zhǔn)則相悖的意見(jiàn)或評(píng)論。為此,Instagram 還公開(kāi)發(fā)布了一個(gè) 1200字的長(zhǎng)文,來(lái)解釋其社區(qū)的精神。
與垃圾郵件過(guò)濾功能的開(kāi)發(fā)過(guò)程類(lèi)似,這次Instagram 又聘請(qǐng)了一大批的人員,每天就重復(fù)干一件事——看評(píng)論,并確定該評(píng)論是否合適。然后將其分類(lèi)是否涉及欺騙 or 種族主義 or 性騷擾等等。所有這些工作人員都必須會(huì)兩種語(yǔ)言。經(jīng)過(guò)一段集中的處理,這些人一共分析了大約200萬(wàn)條評(píng)論。
同時(shí),Instagram的員工率先在自己的手機(jī)上內(nèi)測(cè)了該系統(tǒng),以此協(xié)助公司調(diào)整算法。與垃圾郵件算法一樣,該系統(tǒng)會(huì)基于文本語(yǔ)義來(lái)分析發(fā)帖的人和評(píng)論者(以及其發(fā)表的歷史評(píng)論)之間的關(guān)系。通過(guò)一段時(shí)間對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和使用真實(shí)數(shù)據(jù)對(duì)模型的測(cè)試,Deep Text 已經(jīng)可以探查到文本之間非常細(xì)微的語(yǔ)義差別。
直至今日,Instagram 終于正式宣布兩大工具的上線。
當(dāng)然,就目前這兩大工具而言,仍然存在一些算法缺陷,如當(dāng)被問(wèn)及一些特定句子時(shí),系統(tǒng)無(wú)法給出具體的回應(yīng)。經(jīng)過(guò)前文對(duì) Instagram 這兩個(gè)工具的開(kāi)發(fā)過(guò)程的描述,我們也能看到 Instagram 的AI仍然依賴人類(lèi)的力量,來(lái)訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)。
正如 Facebook歐洲、中東和非洲地區(qū)公共政策副總裁 Richard Allen 如是表述,F(xiàn)acebook“還需要很長(zhǎng)一段時(shí)間,才能依靠機(jī)器學(xué)習(xí)和人工智能來(lái)處理評(píng)估仇視言論時(shí)的復(fù)雜性。”