大數(shù)據(jù)對人工智能的影響有多大
當(dāng)前,以深度學(xué)習(xí)為代表的人工智能技術(shù)已經(jīng)應(yīng)用到各個行業(yè)。驅(qū)動人工智能技術(shù)蓬勃發(fā)展的是各行各業(yè)積累的大數(shù)據(jù)??梢哉f,正是在大數(shù)據(jù)的“喂養(yǎng)”下,人工智能技術(shù)才真正茁壯成長。
然而,在近日召開的香山科學(xué)會議第667次學(xué)術(shù)討論會上,與會專家指出,大數(shù)據(jù)的“紅利”效應(yīng)正在逐漸減弱,人工智能技術(shù)的單點突破難以持續(xù)支撐行業(yè)發(fā)展,亟須在數(shù)據(jù)科學(xué)和計算智能方面突破一些關(guān)鍵核心技術(shù)。
主流AI算法未充分考慮大數(shù)據(jù)復(fù)雜性
人們常常用海量性、多樣性、高速以及價值密度低來描述大數(shù)據(jù)的特點。但真實的大數(shù)據(jù)往往更加復(fù)雜,比如具有不完全性、不確定性、動態(tài)性、關(guān)聯(lián)性等特點。反觀經(jīng)典的人工智能算法,它們對數(shù)據(jù)的假設(shè)往往過于簡單。比如,假設(shè)數(shù)據(jù)是靜態(tài)的,產(chǎn)生于獨立同分布的采樣過程;訓(xùn)練數(shù)據(jù)是可靠的、數(shù)據(jù)所承載的信息是完全的等。
“數(shù)據(jù)的真實復(fù)雜性和算法的簡單假設(shè)之間存在著巨大鴻溝,這使得經(jīng)典智能算法在很多復(fù)雜任務(wù)上表現(xiàn)欠佳,亟待進一步的研究和探索?!睍h執(zhí)行主席之一、中國科學(xué)院院士梅宏強調(diào),大數(shù)據(jù)是人工智能獲得成功的物質(zhì)基礎(chǔ),但目前主流的人工智能算法并未充分考慮大數(shù)據(jù)本身的復(fù)雜性。
從計算和通信領(lǐng)域看,大數(shù)據(jù)與人工智能技術(shù)在大規(guī)模工程化應(yīng)用方面取得了長足進步。然而,大數(shù)據(jù)處理的技術(shù)進步主要體現(xiàn)在:以軟硬件垂直優(yōu)化和體系重構(gòu)的極端化方式來適應(yīng)數(shù)據(jù)規(guī)模、傳輸帶寬和處理速度的提升,研究人員對大數(shù)據(jù)固有的非確定性和復(fù)雜性尚沒有深刻認識;與此同時,人工智能技術(shù)也面臨魯棒性、可解釋性和復(fù)雜系統(tǒng)認知瓶頸等挑戰(zhàn)。
梅宏進一步指出,當(dāng)前數(shù)據(jù)智能存在低效、不通用以及不透明三大問題。“現(xiàn)在的數(shù)據(jù)智能就像工業(yè)革命前的‘蒸汽機原型’一樣,低效而昂貴;它只能針對不同應(yīng)用定制不同模型,難以建立通用模型?!泵泛暾f,更重要的是,當(dāng)前并沒有對數(shù)據(jù)智能形成深刻認識,只是知其然,而不知其所以然。
人機融合或可彌補數(shù)據(jù)自動推理弱點
在中國科學(xué)院自動化研究所研究員陶建華看來,雖然當(dāng)前人工智能在數(shù)據(jù)自動推理中依然面臨很多技術(shù)難點,但是人機融合的推理方式可以有效地彌補這些弱點。人機融合推理著重于研究一種由人和機器相互協(xié)作下的新的推理模式,包含“機器懂人”和“人懂機器”兩方面的含義。
對人的推理思維的理解是“機器懂人”的關(guān)鍵。其核心問題是如何構(gòu)建能夠反映人推理過程的思維形式化計算方法。該方法將人的推理思維形式化描述、概率推理、構(gòu)建知識圖譜,以及與現(xiàn)實場景的信息進行有機融合,從而可以將人的推理過程有效的輸入到機器中,并與機器的推理網(wǎng)絡(luò)進行結(jié)合。
此外,解決“人懂機器”問題將有助于人對機器智能輔助增強。機器推理過程的可解釋性,對于構(gòu)建人機融合的推理過程尤為關(guān)鍵。過程可解釋的機器推理方法提供了解決問題的新方法,適當(dāng)?shù)臄U展流程,并最大限度地減少人為錯誤的機會,可以幫助人類和機器協(xié)同做出更為準確和迅速的推理與判斷。
微軟亞洲研究院副院長劉鐵巖結(jié)合他們的實際工作舉例道:“我們在深度強化學(xué)習(xí)的基礎(chǔ)上,利用‘完美教練’技術(shù)來處理信息的不完全和不確定性,從而很好地解決了麻將這一復(fù)雜的博弈問題。我們的算法在2019年3月登陸知名的競技麻將平臺,經(jīng)過5000局的鏖戰(zhàn),成功晉級十段,其穩(wěn)定段位顯著超越人類頂級選手,成為首個超人麻將AI?!边@是在處理數(shù)據(jù)不完全性和不確定性方面做出的有益嘗試。
劉鐵巖指出,大數(shù)據(jù)特性在不斷演化,且愈發(fā)復(fù)雜。新型智能算法需要針對數(shù)據(jù)特點有的放矢地解決問題,這樣才能填補數(shù)據(jù)與算法間的鴻溝,使人工智能綻放更多的價值。