人工智能寫文章能力正接近人類 但我們不需要太過擔(dān)心
憑借著極為可觀的文本量儲備,一種新的算法能夠撰寫出令人信服的文章,這同時也標(biāo)志著AI技術(shù)未來有可能被用于對普通民眾施以整體性蒙蔽。
下面來看幾條虛假新聞……
繼特朗普意外發(fā)射遠(yuǎn)程導(dǎo)彈之后,俄羅斯已經(jīng)正式向美國宣戰(zhàn)。
俄羅斯方面表示,其已經(jīng)“確定了導(dǎo)彈的飛行軌跡,并將采取必要打電話以確保俄羅斯人民以及該國戰(zhàn)略核打擊力量的安全?!卑讓m方面亦做出回應(yīng),指出“正在對俄羅斯違反禁令發(fā)射中程彈道導(dǎo)彈的行為給予高度關(guān)注?!?/p>
自2014年莫斯科方面吞烏克蘭克里米亞地區(qū)并決定支持烏克蘭東部的分裂主義分子以來,美國與俄羅斯之間的關(guān)系一直處于不穩(wěn)定狀態(tài)。
這里提到的新聞內(nèi)容不僅純屬偽造,同時也標(biāo)志著AI技術(shù)已經(jīng)能夠在很大程度上愚弄普通人類。
因為事實上,這些消息并非由人類所撰寫。所有內(nèi)容都來自某一自動生成算法,其需要的全部素材就只是作為開頭的“繼特朗普意外發(fā)射遠(yuǎn)程導(dǎo)彈之后,俄羅斯已經(jīng)正式向美國宣戰(zhàn)……”
接下來的工作完全可以由該項目獨立完成。其能夠為大家提供與任何給定主題相關(guān)的、極為翔實逼真的新聞報道。這一項目由位于舊金山的研究機構(gòu)OpenAI團隊開發(fā)完成。
該團隊的研究人員們著手開發(fā)出一種通用語言算法,此種算法能夠通過網(wǎng)絡(luò)上的大量文本進(jìn)行訓(xùn)練,從而實現(xiàn)文本翻譯、問題回答并執(zhí)行其它一些高實用性任務(wù)。但在過程當(dāng)中,研究人員們很快開始擔(dān)心這項技術(shù)遭到濫用的可能性。OpenAI團隊政策主管Jack Clark表示,“我們開始對其進(jìn)行測試,并很快發(fā)現(xiàn)其能夠輕易生成各類惡意內(nèi)容?!?/p>
Clark解釋稱,該項目的實際表現(xiàn)暗示著人工智能技術(shù)完全可能被用于自動生成令人信服的虛假新聞、社交媒體發(fā)帖或者其它文字內(nèi)容。更具體地講,此類工具有可能在總統(tǒng)選舉期間發(fā)布影響整體政治氣候的新聞報道或者丑聞。時至今日,虛假新聞已經(jīng)成為一大嚴(yán)重威脅,而如果此類內(nèi)容能夠自動生成,那么結(jié)果將更加無法想象。另外需要強調(diào)的是,這種算法還能夠針對特定人群的統(tǒng)計特征甚至個人偏好進(jìn)行具體優(yōu)化。
Clark表示,在不久的將來,人工智能也許會以可靠的方式及效率大規(guī)模發(fā)布虛假故事、偽造推文或者其它極具說服力的誤導(dǎo)性評論。他指出,“很明顯,一旦這項技術(shù)走向成熟——也許還需要一到兩年——其完全可以被用于虛假信息的生成或宣傳。我們正在努力解決這個巨大的隱患?!?/p>
當(dāng)然,這種技術(shù)也有著可觀的積極發(fā)展空間,例如用于總結(jié)文本內(nèi)容或者改善聊天機器人的會話功能。Clark指出,他甚至利用這款工具自動為短篇科幻小說生成相應(yīng)段落,而且結(jié)果取得了驚人的成功。
OpenAI團隊主要進(jìn)行基礎(chǔ)性人工智能研究,但同時也在強調(diào)人工智能的潛在風(fēng)險方面發(fā)揮著積極的作用。該組織參與了2018年關(guān)于AI風(fēng)險的研究報告,其中也提到了由此帶來誤導(dǎo)性信息的可能性(這很可能與《黑鏡》劇集中的某些情節(jié)類似,亦使得不少專家呼吁對AI技術(shù)成果進(jìn)行保密)。
好消息是,這種OpenAI算法并不總能騙過那些擁有一定識別能力的讀者。在大多數(shù)情況下,根據(jù)所給出的提示,它只會產(chǎn)生表面上連貫、但內(nèi)容卻并不通順的亂碼或文字,這些結(jié)果似乎是受到了某些網(wǎng)絡(luò)新聞源的污染。
然而,它確實非常擅長撰寫極為真實的文本,這亦反映出將機器學(xué)習(xí)應(yīng)用于自然語言領(lǐng)域的一大最新進(jìn)展。
OpenAI團隊原本是打算為《MIT Technology Review》雜志提供文本生成工具,但測試當(dāng)中暴露出的問題致使他們擔(dān)心這項技術(shù)可能會被濫用,因此目前僅公開提供一套簡化版本。另外,該團隊正在著手整理一篇用于概述此項工作的研究論文。
人工智能技術(shù)的快速進(jìn)步正逐漸幫助機器更好地掌握人類語言。最近的工作正通過向通用型機器學(xué)習(xí)算法提供極大規(guī)模的文本來獲取可喜的效果提升。OpenAI團隊計劃將這方面效果提升至新的水平:他們的系統(tǒng)從網(wǎng)絡(luò)之上獲得了4500萬頁文本,全部選取自Reddit網(wǎng)站。與大多數(shù)語言算法相比,OpenAI的這一項目不需要對文本內(nèi)容進(jìn)行標(biāo)記或者人為篩選,而能夠直接學(xué)習(xí)所饋送數(shù)據(jù)當(dāng)中存在的各類模式。
Salesforce公司自然語言處理專家兼首席科學(xué)家Richard Socher評論稱,OpenAI的工作成果代表著高度通用化語言學(xué)習(xí)系統(tǒng)領(lǐng)域的最新典范。他在接受郵件采訪時寫道,“我認(rèn)為這些通用型學(xué)習(xí)系統(tǒng)代表著未來的發(fā)展方向。”
而在另一方面,Socher表示并不太關(guān)注這項技術(shù)被用于生成欺騙性及誤導(dǎo)性信息的問題。他總結(jié)稱,“大家根本不需要利用人工智能來制造假新聞,畢竟普通人就能很輕松地完成這項工作?!?/p>