亞太內(nèi)容分發(fā)大會暨CDN峰會一直致力于推動CDN產(chǎn)業(yè)深度融合發(fā)展和市場普及,現(xiàn)已成為亞太地區(qū)影響力最大的內(nèi)容分發(fā)網(wǎng)絡(luò)盛會。十年來,在以阿里云、網(wǎng)宿科技、騰訊云等亞太CDN產(chǎn)業(yè)聯(lián)盟成員孜孜不輟的努力下,CDN產(chǎn)業(yè)已經(jīng)成為基礎(chǔ)性設(shè)施網(wǎng)絡(luò),以堅定的基石之姿,支撐起中國成為世界最大的互聯(lián)網(wǎng)市場。
隨著全球數(shù)字化、“一帶一路”戰(zhàn)略的推進(jìn),亞太內(nèi)容分大會暨CDN峰會的影響力正在逐漸向全球延伸,同時也將中國智造CDN及產(chǎn)業(yè)鏈推廣向全球每一個角落。
在6月10日下午舉辦的【運營商論壇】上,BIGO資深產(chǎn)品專家,Aestron AI產(chǎn)品負(fù)責(zé)人發(fā)表了題為《AI內(nèi)容智能鑒審 多場景一體化應(yīng)用》的精彩演講。
關(guān)于BIGO
為了讓聽眾對BIGO有更加清晰的認(rèn)知,蔡明衛(wèi)在開場首先介紹了BIGO的發(fā)展歷程。BIGO成立于2014年,是一家高速發(fā)展的科技公司,基于強大的實時音視頻技術(shù)、人工智能技術(shù)、CDN技術(shù),推出了一系列音視頻類社交及內(nèi)容產(chǎn)品。包括 Bigo Live、Likee、imo、Hello 語音等。目前BIGO已經(jīng)服務(wù)超過150個國家和地區(qū),積累月活用戶近四億,在全球范圍內(nèi)擁有谷歌、騰訊云、華為、小米等諸多合作伙伴。
BIGO不局限于自身的成功,也希望幫助更多的出海企業(yè)獲得成功?;谶@樣的理念,BIGO推出了企業(yè)服務(wù),用多年積累的技術(shù)底蘊和經(jīng)驗,幫助企業(yè)構(gòu)建共贏新生態(tài)。蔡明衛(wèi)就BIGO企業(yè)服務(wù)的產(chǎn)品矩陣進(jìn)行了展示。
一站式內(nèi)容智能鑒審方案
蔡明衛(wèi)表示,本次演講的主題是AI領(lǐng)域的內(nèi)容安全。BIGO擁有自主人工智能實驗室,研究目前AI的前沿技術(shù)。在計算機(jī)視覺方面,BIGO利用人臉檢測、屬性識別技術(shù),判斷用戶的性別、年齡,在識別人的基礎(chǔ)上,再進(jìn)行精準(zhǔn)的標(biāo)簽化,對問題或場景進(jìn)行“精準(zhǔn)打擊”??梢杂行У淖R別多種風(fēng)險場景,例如國內(nèi)當(dāng)前關(guān)注的未成年人沉迷網(wǎng)絡(luò)問題、歐美關(guān)注的戀童癖等問題。BIGO基于全球化強大的數(shù)據(jù)壁壘,能夠覆蓋各種不同膚色及人種。
在語音技術(shù)方面,通過端到端的語音識別技術(shù),僅用一個模型就可以實現(xiàn)音頻到文字的轉(zhuǎn)化。BIGO還提供全球多語種的語音識別技術(shù),結(jié)合自然語言處理和運營多年的敏感詞積累,能夠快速地對語音中的違規(guī)內(nèi)容進(jìn)行識別。目前主要應(yīng)用于泛娛樂、游戲電商、教育、云游戲等場景,對應(yīng)的具體場景有短視頻、直播、聊天室等,其中大量的內(nèi)容都需要進(jìn)行合規(guī)性的把控。BIGO的上述技術(shù)幫助客戶業(yè)務(wù)取得了不錯的成績。
大多數(shù)一般用戶關(guān)注的是正常內(nèi)容,而內(nèi)容安全關(guān)注的是對生態(tài)影響很大的內(nèi)容,如色情、管制器具等。蔡明衛(wèi)表示,BIGO的圖像檢索識別,對刀具、槍等大型武器,還有二維碼、廣告等能夠進(jìn)行有效識別。二維碼和廣告屬于對端內(nèi)的導(dǎo)流,會對已有的比較成熟的產(chǎn)品造成不良影響。
BIGO的圖像易反感識別,針對血腥、暴恐和畸形內(nèi)容,以及涉及到敏感標(biāo)識物、領(lǐng)導(dǎo)人、宗教人物、社會事件、敏感意圖(如爭議區(qū)域的劃分歸屬)等內(nèi)容,同樣能進(jìn)行有效識別。如果不能進(jìn)行有效把控,會嚴(yán)重影響輿論走勢。敏感事件的識別,有些場景還會用到OCR技術(shù),一些特殊情況如圖片不違規(guī)但圖中文字內(nèi)容違規(guī),涉及個人信息的視頻字幕等,需要提取相應(yīng)的文字內(nèi)容進(jìn)行違規(guī)性的過濾。
除上述圖像識別技術(shù)外,BIGO還擁有音頻識別技術(shù),ASR支持全球多個主流語種,對語音聊天室的復(fù)雜語音環(huán)境能夠進(jìn)行有效、精準(zhǔn)的識別。此外,嬌喘、騷擾、辱罵識別,能夠?qū)Ρ容^敏感的話語進(jìn)行識別。目前,從BIGO客戶的業(yè)務(wù)反饋來看,識別模型無論在國內(nèi)還是國外都取得了優(yōu)良的效果,能夠精準(zhǔn)的識別場景,標(biāo)記并做精準(zhǔn)打擊。
文字識別領(lǐng)域,BIGO在全球范圍內(nèi)積累了業(yè)內(nèi)領(lǐng)先的全球敏感詞庫,涵蓋全球主流語種、小語種的敏感內(nèi)容。對于某些單個詞匯不構(gòu)成違規(guī)但具體語境違規(guī)的,可以通過自然語言理解模型,識別對應(yīng)違規(guī)內(nèi)容。
內(nèi)容智能鑒審產(chǎn)品優(yōu)勢
蔡明衛(wèi)總結(jié)說,BIGO提供的整體方案包括四大類:圖片、視頻、語音、文字。
其中圖片、視頻能夠識別多種場景,還能夠?qū)D片、視頻的畫面內(nèi)容、文字內(nèi)容進(jìn)行識別。語音方面還可以對視頻語音進(jìn)行識別,也可以對純音頻的特定場景識別,像嬌喘、干擾音等。對應(yīng)文字語意的違規(guī)可以先通過技術(shù)把音頻轉(zhuǎn)化成文字,再過敏感詞庫、NLP模型,有效識別違規(guī)內(nèi)容。
在最近的一次對標(biāo)測試中,相同推送情況下,BIGO模型比對方多出近兩倍的召回。
這首先歸功于BIGO強大的技術(shù)保障,超過一千二百名的技術(shù)人員的努力。全鏈路發(fā)展多模型路線,能夠?qū)Χ喾N場景和內(nèi)容做多標(biāo)簽管理。BIGO還擁有全球化的運營團(tuán)隊,根據(jù)輿情最新的內(nèi)容采集風(fēng)險樣本,快速融入算法優(yōu)化流程,對于比較敏感的數(shù)據(jù),運營團(tuán)隊將實時通知各團(tuán)隊對樣本進(jìn)行調(diào)整,迅速自動化完成模型更新迭代,攔截對應(yīng)的風(fēng)險內(nèi)容。
在數(shù)據(jù)保障上,為了保障數(shù)據(jù)的準(zhǔn)確性,BIGO從2017年開始就搭建了全球本地化標(biāo)注團(tuán)隊,特別針對海外小語種的標(biāo)注。對于高難度的任務(wù),標(biāo)注準(zhǔn)確度亦超99%,以保障高質(zhì)量的機(jī)器學(xué)習(xí)能力。
BIGO在同類競品中一直處于領(lǐng)先地位,蔡明衛(wèi)也在演講最后表達(dá)了BIGO在技術(shù)方面的強大信心和強烈的合作意愿,希望與更多伙伴合作,連接美好世界,傳遞快樂生活!