現(xiàn)在還需要人為鑒別真假嗎
近日公布的《中老年人上網(wǎng)狀況及風(fēng)險(xiǎn)網(wǎng)絡(luò)調(diào)查報(bào)告》顯示,近六成中老年曾遭受過網(wǎng)絡(luò)謠言的危害。要想不被網(wǎng)上的流言和謠言盅惑、傷害,首先需要對(duì)其進(jìn)行科學(xué)甄別,而時(shí)下人工智能正在嘗試擔(dān)任這一角色。那么,在打假一線人工智能(AI)技術(shù)如何做到去偽存真?這樣的“本領(lǐng)”可應(yīng)用在哪些領(lǐng)域?
據(jù)了解,目前國內(nèi)已有的主要識(shí)謠、辟謠平臺(tái)基本還是依靠專家識(shí)別模式,其存在一定的問題:發(fā)現(xiàn)線索主要依賴用戶舉報(bào),數(shù)量有限,時(shí)效性不強(qiáng),往往是事件已造成負(fù)面影響才“后知后覺”;此外,新聞?wù)J證速度有待提高。
為提高識(shí)謠效率,目前中科院計(jì)算機(jī)研究所、阿里、騰訊等多家企業(yè)和機(jī)構(gòu)已經(jīng)開展了人工智能識(shí)謠工作。曹娟帶領(lǐng)團(tuán)隊(duì)從2013年開始致力于開展基于人工智能技術(shù)的虛假信息檢測(cè)研究,她介紹,AI識(shí)謠公眾平臺(tái)可自動(dòng)及時(shí)發(fā)現(xiàn)可疑線索并進(jìn)行認(rèn)證,大大降低謠言可能帶來的危害;通過機(jī)器學(xué)習(xí)算法輔助人工審核,僅需1分鐘即能對(duì)疑似謠言事件發(fā)出預(yù)警;基于數(shù)據(jù)驅(qū)動(dòng)的方法,平臺(tái)還可不斷挖掘出不同類別謠言的特性,實(shí)現(xiàn)對(duì)各種謠言地自動(dòng)識(shí)別。不過,需要指出的是,“虛假信息識(shí)別是一個(gè)高度復(fù)雜的問題,想要完全依靠AI審核內(nèi)容,可能尚需5—10年時(shí)間?!?/p>
目前,中科院計(jì)算所開發(fā)的辟謠平臺(tái)已積累數(shù)萬條假新聞信息,累計(jì)認(rèn)證數(shù)十萬次。通過平臺(tái)積累的數(shù)據(jù),目前可從新聞質(zhì)量的角度把杜撰的新聞文本大致分為三類:一完全杜撰,往往是在真實(shí)存在的實(shí)體上編造情節(jié);二半真半假,可能描述的前半段是真,后半段就展開不可靠的想像,或者一部分是真,但在關(guān)鍵情節(jié)上添油加醋;三舊聞新傳、移花接木,事件本身可能存在,但發(fā)布者故意模糊化甚至篡改原事件中的時(shí)間、地點(diǎn),讓人誤以為事情剛剛發(fā)生在當(dāng)?shù)乇弧?/p>
除去文字造假,圖片視頻造假也越來越多?!拔覀儗⑻摷傩侣勁鋱D分為復(fù)用的過時(shí)圖片、能引起歧義的誤導(dǎo)性圖片及篡改圖片。假新聞通常呈現(xiàn)出新聞要素缺失、圖像質(zhì)量低、內(nèi)容包含色情敏感廣告等低俗信息,以及圖文不匹配等特點(diǎn)。例如,有些假新聞中的配圖會(huì)出現(xiàn)滿屏彌漫沖天大火、公路凹陷深坑、被棄男童在垃圾廢墟前嚎啕等畫面?!辈芫昝枋龅溃爸{言更易形成病毒式擴(kuò)散的趨勢(shì),而真實(shí)新聞的擴(kuò)散速度和爆發(fā)度要溫和許多?!?/p>
“從核心技術(shù)上,AI甄別謠言依賴于‘三多’?!辈芫暾f,一是多模態(tài)數(shù)據(jù),謠言從發(fā)布、傳播到被辟謠的生命周期中,可能會(huì)伴隨產(chǎn)生文字、圖片、視頻、傳播網(wǎng)絡(luò)、參與用戶屬性等多種模態(tài)的數(shù)據(jù),各模態(tài)數(shù)據(jù)均能不同程度指示謠言,例如謠言文字的情感傾向、圖片的視覺沖擊力、傳播網(wǎng)絡(luò)的結(jié)構(gòu)屬性等,但沒有哪種模態(tài)的數(shù)據(jù)擁有獨(dú)立完全的謠言指示能力,所以要盡可能獲取不同模態(tài)的數(shù)據(jù)。
二是多層次表示,深度學(xué)習(xí)技術(shù)有強(qiáng)大的表示學(xué)習(xí)能力,經(jīng)過神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和融合機(jī)制的設(shè)計(jì),AI模型可以在面對(duì)眾多意義、形式、結(jié)構(gòu)都不同的模態(tài)數(shù)據(jù)時(shí),綜合不同層次數(shù)據(jù),自動(dòng)找出最有區(qū)分能力的表示組合,并將待甄別文章對(duì)應(yīng)的文字、圖片、傳播網(wǎng)絡(luò)等融合投射到特征空間中。
三是多角度判斷,AI可以從單一方面(如內(nèi)容、用戶、傳播)給出可信度,也可以全面觀察,給出綜合所有信息的可信度,及時(shí)幫助人們“揪出”可信度不高的信息。