AI能夠實現(xiàn)預測疫情嗎
新冠肺炎疫情仍在全球各地迅速蔓延,死亡人數(shù)不斷攀升。這場全球性災難對全世界的經(jīng)濟、政治、文化將產(chǎn)生深遠的影響。在控制疫情的同時,我們也需要反思如何才能防止今后類似的災難再次發(fā)生。
事實上,早在2019年12月31日,加拿大人工智能健康監(jiān)測平臺BlueDot,就向其客戶發(fā)出了第一條有關疫情的警告。這早于世界衛(wèi)生組織(2020年1月9日)和美國疾控中心(2020年1月6日)發(fā)布疫情警告的時間。
之所以BlueDot能早于世界各大衛(wèi)生組織發(fā)布疫情預警,正是因為BlueDot應用人工智能技術、自然語言處理以及網(wǎng)絡爬蟲技術不間斷地收集、分析世界各地關于疾病和重大公共衛(wèi)生事件的報告和評論,高效地從海量的數(shù)據(jù)中提取出關鍵的數(shù)據(jù),并智能地判斷全球疫情大暴發(fā)的可能性。
但準確預測疫情并非一件易事,這包括海量數(shù)據(jù)的收集和處理、針對有效信息的篩選、虛假信息的自動剔除等。若是靠人為地處理這些數(shù)據(jù),不僅效率低下,而且很難保證信息的有效和及時,尤其是在疫情的初期,僅有一些瑣碎的有效信息夾雜在各式各樣的信息“噪音”之中的情況下,更是如此。
所幸,人工智能技術正是處理海量數(shù)據(jù)的能手。人工智能技術讓計算機在某個領域擁有一定的學習能力,并能將學習到的知識應用到真實的場景中,輔助人類做決策。
人工智能技術預測疫情表現(xiàn)不俗
早在2015年,英國倫敦大學學院的研究員就嘗試結合人工智能與互聯(lián)網(wǎng)信息(例如Twitter信息與評論)對大流行病的傳播進行了有效的預測。該科研成果發(fā)表在了2015年的Scientific Reports。此后,倫敦大學學院的科學家們通過繼續(xù)收集不同的互聯(lián)網(wǎng)數(shù)據(jù)(例如搜索引擎指數(shù)),大大提高了人工智能模型對疫情的蔓延預測的準確度。
在預測疫情趨勢方面,基于疫情高危人群相關數(shù)據(jù),結合疫情新增確診、疑似、 死亡、治愈病例數(shù),借助傳播動力學模型、動態(tài)感染模型、 回歸模型等大數(shù)據(jù)分析模型和實踐技術,人工智能技術不僅可以展示發(fā)病熱力分布和密切接觸者的風險熱力分布,還可以進行疫情峰值拐點等大態(tài)勢研判。
▲圖片來源:新京報網(wǎng)
在預測疫情傳播和追根溯源方面,利用深度學習等新興人工智能技術,聯(lián)合出行軌跡流動信息、社交信息、消費數(shù)據(jù)、暴露接觸史等大量數(shù)據(jù)進行科學建模,可以根據(jù)病患確診順序和密切接觸人員等信息定位時空碰撞點,進而推算出疾病傳播路徑,為傳染病溯源分析提供理論依據(jù)。
這與傳統(tǒng)的疫情傳播預警系統(tǒng)大相徑庭。傳統(tǒng)系統(tǒng)繪制病毒的潛在傳播情況并向有關部門發(fā)出警報,可能需要數(shù)周時間,而政府有時會在幾周或幾個月后才公布數(shù)據(jù)。
現(xiàn)在,由于人工智能和大數(shù)據(jù)已經(jīng)徹底改變了傳染病暴發(fā)路徑的追蹤和預測方法,實時預測和提前預警已成為可能。
通過使用互聯(lián)性越來越強、移動化的世界所生成的信息,比如從搜索關鍵字數(shù)據(jù)頻率,人們點擊維基百科頁面的位置等各種信息等,用深度學習等人工智能技術結合云端處理技術就可以實現(xiàn)海量的數(shù)據(jù)挖掘。
BlueDot正是應用了人工智能技術,對海量的文本數(shù)據(jù)進行分析和篩選,才能快速準確地預測到這次新冠病毒導致的疫情。
使用自然語言處理和機器學習算法來查看衛(wèi)生組織的聲明、商業(yè)航班、牲畜健康報告、衛(wèi)星氣候數(shù)據(jù)和新聞報道,不僅可以預測流行病的開始,還可以預測它將如何傳播。
基于人工智能的快速疫情預測為這場疫情戰(zhàn)爭分奪秒,大大提高了抗疫措施的時效性,讓防疫措施有的放矢。
現(xiàn)階段AI疫情預測還需人工干預
然而,現(xiàn)階段人工智能在疫情預測的過程中還需要一定程度的人工干預,需要人們更深入地研究不同的疫情案例。
受限于目前人工智能技術,疫情預測系統(tǒng)極易被觸發(fā)、被忽略,同時系統(tǒng)還可能生成大量的假陽性結果。
正如開發(fā)BlueDot的公司“HealthMap”的創(chuàng)辦人,約翰·布朗斯坦所說,“數(shù)據(jù)會基于人們在網(wǎng)上的行為不斷變化,所以你必須不斷重新調(diào)整你的算法”。
同樣BlueDot的疫情預測系統(tǒng)也需要包括地理信息系統(tǒng)、空間分析、計算機科學,臨床傳染病、旅游和熱帶醫(yī)學以及公共衛(wèi)生方面的醫(yī)學專家來審查人工智能標記的信息。
相信隨著人工智能的不斷發(fā)展和算力的不斷提升,更泛化的人工智能,或基于數(shù)據(jù)自適應的算法實現(xiàn)也將會變成可能。
使用人工智能技術做疫情預測還在一定程度上依賴于數(shù)據(jù)的質量和可得性。比如一旦疫情為人所知,政府開始禁止地區(qū)或者國家間的人員流動,旅行模式就發(fā)生了變化。繼續(xù)使用航空公司的歷史數(shù)據(jù)來用人工智能作為預測將會降低模型的準確性。
而使用人工智能處理智能設備的實時地理數(shù)據(jù),可以更好地分析疫情的聚散和傳播軌跡。
以色列政府采用反恐級別的技術監(jiān)控來追蹤疫情,通過嚴密監(jiān)控人們的智能手機和面部攝像頭以及體溫報告,可以快速識別病毒攜帶者并提醒與感染者的距離。不過在重視數(shù)據(jù)隱私的西方國家,這種數(shù)據(jù)的可得性將會限制并影響人工智能技術的表現(xiàn)。
人工智能預測疫情尚有提升空間
雖然人工智能在疫情傳播預測中發(fā)揮了重大作用,但從這次疫情發(fā)展過程來看,人工智能仍有很大空間值得挖掘和提升。
目前公開渠道獲取的疫情數(shù)據(jù)口徑、數(shù)據(jù)統(tǒng)計時間等維度不統(tǒng)一、數(shù)據(jù)源混雜重復、數(shù)據(jù)質量不高,為人工智能處理分析帶來很大困難,極大地影響了預測系統(tǒng)的穩(wěn)健性與準確性。
并且各廠商之間的人工智能預測模型所需的數(shù)據(jù)流通不足,不同的預測系統(tǒng)之間的數(shù)據(jù)是分散割裂,進而數(shù)據(jù)的價值、人工智能的模型不能得到最大化的利用。這些都是人工智能技術用于預測疫情所急需解決的問題。
利用AI技術,我們將不僅可以準確地預測類似本次新型冠狀病毒的疫情,還可以在疫情控制、病情診斷、疫苗研發(fā),以及社會經(jīng)濟等方面幫助我們輕松戰(zhàn)勝未來可能發(fā)生的其他疫情。
就像石油在第二次第三次工業(yè)革命中的作用一樣,人工智能技術在第四次工業(yè)革命起到了至關重要的作用。相信,在未來面對疫情時,有了人工智能的助力,我們將可以從容應對,不再恐慌。