由中國商務部、科技部、工信部、國家發(fā)改委、農(nóng)業(yè)農(nóng)村部、國家知識產(chǎn)權局、中國科學院、中國工程院等國家部委和深圳市人民政府共同舉辦的“第二十一屆中國國際高新技術成果交易會”于2019年11月13日-17日在中國深圳舉行。德國哈索-普拉特納數(shù)字工程研究院院長,波茨坦大學數(shù)字工程學部主任,德國國家科學工程院院士克里斯托夫·梅內爾出席“改變世界的新興科技”論壇并演講。
克里斯托夫·梅內爾表示,人工智能也會有不同的階段和不同的形式,人工智能不僅僅是我們去定義的,現(xiàn)在有不同的技術,它們都是人工智能的基礎,包括機器學習、表示性學習和深度學習。如果我們回溯歷史,我們發(fā)現(xiàn)我們是第三次人工智能發(fā)展大浪潮了。第一次是上世紀50年代,那時候計算機進入到我們的視野。第二次人工智能的浪潮是在上實際九率80年代,當時有很多相應的研究機構都在收集數(shù)據(jù),有很多人都會想我們作為人在作決策的時候會有一些原則和法則。不是這樣子,我們發(fā)現(xiàn)在做決策的時候也沒有那么多的原則可以遵守,或者說有的時候法則太多了根本就收集不了。
以下為演講實錄:
女士們、先生們,今天非常高興來到這里跟大家打一個來自德國的招呼,我是克里斯托夫·梅內爾,是德國哈索-普拉特納數(shù)字工程研究院的院長,我們主要關注互聯(lián)網(wǎng)安全以及未來的技術,以及在互聯(lián)網(wǎng)行業(yè)的技術應用。一個德國式的比爾蓋茨式人物,哈索-普拉特納 (SAP的創(chuàng)始人和現(xiàn)任主席) 創(chuàng)建了我們這個機構,有很多學生在我們機構學習,也會跟其他的中國大學合作, 比如南京大學等。我們的目標是希望進行數(shù)字化轉型,能夠推動德國的數(shù)字化轉型。我們知道有很多創(chuàng)新都是來自于我們的機構,今天不細談這個。當下我們正在進行一個試點性的項目,我們也有網(wǎng)上的慕課課程,它是德國的課程,但是有很多學校都可以使用這個課程。今天我想跟大家談的是人工智能的現(xiàn)實。
大家都知道人工智能跟機器學習有關,機器是從數(shù)據(jù)當中學習,它就像人學習一樣,我們看到周邊的世界然后會從中學習。計算機就可以看、可以聽、可以讀、可以感受、也可以理解。為什么人工智能是現(xiàn)在出現(xiàn)?我們之前所做的據(jù)測都非常重要,比如我們有大數(shù)據(jù),有很多的電子大數(shù)據(jù),包括聲音、圖片等。我覺得它非常大地改變了硬件設備,比如有一些儲存的設備和記憶設備,它能夠分析大數(shù)據(jù),能夠實時進行分析,包括云計算?,F(xiàn)在很多的開發(fā)者都在談計算力,現(xiàn)在互聯(lián)網(wǎng)上也有的計算力。我們在人工智能方面也有新的發(fā)展,就是深度學習和相應的算法,這些都是我們所開發(fā)出來的?,F(xiàn)在我們先談一下大數(shù)據(jù),為什么我們需要機器學習。
上面有幾個數(shù)字,比如大家看到有400小時的視頻,每分鐘會有400小時長的視頻傳到y(tǒng)outube網(wǎng)絡當中,如果用機器學習這種方式的話,每秒就會創(chuàng)造出10GB的數(shù)據(jù),每小時會有350億個物聯(lián)網(wǎng)設備收集數(shù)據(jù)。大家現(xiàn)在都使用智能手機,有5億人在使用手機,我相信阿里巴巴會收集很多數(shù)據(jù)。為什么我們覺得機器學習非常難做?這些圖片人眼看的話比較簡單,比如它是黑的還是淺色的,它是泰迪熊還是可愛的狗,我們希望用機器去回答這些問題,這些問題對人類來說有的時候也不容易回答。
人工智能也會有不同的階段和不同的形式,人工智能不僅僅是我們去定義的,現(xiàn)在有不同的技術,它們都是人工智能的基礎,包括機器學習、表示性學習和深度學習。如果我們回溯歷史,我們發(fā)現(xiàn)我們是第三次人工智能發(fā)展大浪潮了。第一次是上世紀50年代,那時候計算機進入到我們的視野,那時候我們就會想如果計算機可以思考的話是不是可以向人類那樣做出行為,是不是可以改變我們的世界。第二次人工智能的浪潮是在上實際九率80年代,當時有很多相應的研究機構都在收集數(shù)據(jù),那時候有很多人都會想我們作為人在作決策的時候會有一些原則和法則。我們要把寫法則給具體起來,把這些法則放到電腦當中,這樣的話機損級是不是就可以跟人一樣做決策了。但是后來事實并不是這樣子,我們發(fā)現(xiàn)在做決策的時候也沒有那么多的原則可以遵守,或者說有的時候法則太多了根本就收集不了。
第三個階段是五六年前,當時深度學習非常成功,深度學習我們會發(fā)現(xiàn)也是編程的方式,我們會用一個架構,這個架構的運作方式跟我們的大腦非常像,我們有很多的網(wǎng)絡,這些小的網(wǎng)絡都是相互聯(lián)系的,這是計算機深度學習的方式。機器跟人的大腦一樣,我們需要學習的材料來幫助機器去學習,機器也需要學習,這些都是一些圖片的數(shù)據(jù)集,我們會使用這些圖片來訓練人工智能或深度計算的算法。我們用圖片來訓練機器,機器看到這些圖片的時候是沒有解釋的,我們問這個機器圖片上是什么,是有人的特征,還是有人的特征,還是說是其他的特征,這些都是機器要解決的。我們發(fā)現(xiàn)計算機深度學習網(wǎng)絡在識別圖片的時候質量也在不斷下降,這是它們面臨的挑戰(zhàn)。
在2015年和2018年的時候有兩個領域,一個是深度學習的算法,有時候算法可以超過人腦,另外一個是在圖像識別方面。左邊是曲線,也就是算法準確度的曲線,還有人的識別準確度的曲線,我們發(fā)現(xiàn)機器的準確率已經(jīng)遠超過人類,在其他領域,深度學習運作非常好的就是語音的識別。所以所有的機器人翻譯都是基于語音的識別,有時候我們會發(fā)現(xiàn)機器出來的結果要比人更好。這是人腦,大家知道人腦會有不同的分區(qū),不同的分區(qū)會負責不同的活動,在這邊主要是負責識別曲線,之后信息會去到大腦不同的區(qū)域,這些曲線會集合起來,包括它們會形成鼻子或者形成嘴,之后這個信息又到了大腦的另一個區(qū)域,在這個區(qū)域當中,我們又把鼻子加上去,加到臉上,機器才能識別別人的臉。這就是我們最大程度的認知,它可能想起昨天的所見所聞。
我們的AI也是卷積式的認識網(wǎng)絡,在某一個神經(jīng)節(jié)點代表著不同的算力,或者是加法、乘法,就是信息對加減乘除的處理,在卷積后面有一個結果能夠解釋這個形象人腦會給它加一個字幕在下面,就是對它進行描述和畫像,去了解它在這個網(wǎng)絡里面有什么樣的指證。第一級別是看到顏色,第二級別是看到不同的內容,就是基于顏色有更高級別的認知,更上一級能夠看到有不同的物體,最后你就能夠對它有一個總體的畫像和認知,到了最高級別你就知道它是什么,就是對它有一個抽象,在你的腦袋里面有一個抽象的萃取,這就是我們對卷積層級網(wǎng)絡的回顧。
基于我們對它的架構分析,基于卷積網(wǎng)絡,能夠更好地萃取不同層級的信息產(chǎn)出一個結果,用更加精準的方法達到產(chǎn)出的結果。這里我給大家舉一個例子,汽車是怎樣在街上進行行駛證、進行判定。這里面我給大家展示一個原理圖,在右上腳,這是一個卷積網(wǎng)絡,在這里面它得到了微調,會微調來集合它的學習目標,能夠基于不同的節(jié)點建立起來。在這里面看到信息不問上升或信號不斷衰減,或者信號不斷增強,這個網(wǎng)絡也會進行調整,進行流量的處理,這都是基于不同神經(jīng)節(jié)點的聯(lián)系。可以看到這里面汽車啟動了,如果它不能捕捉這個線路的話就會發(fā)生碰撞。當這個汽車可以自主學習的時候,網(wǎng)絡可以被訓練,汽車的自動駕駛系統(tǒng)可以被訓練,能夠讓汽車知道怎么做下一步的決策,不會發(fā)生碰撞。
因此需要一系列的學習成果的生成才能進行這個系統(tǒng)的訓練,這個車的系統(tǒng)得到訓練之后,才可以進行下一步碰撞的測試。每一次嘗試無論是成功還是失敗,這個網(wǎng)絡都會重新得到構建,參數(shù)不斷變化,因為周圍的環(huán)境不斷變化。這就是通過變化的環(huán)境不斷收取變化的信號,無論是增強還是衰減。對于這些顏色的認知,顏色是加深了,就是對它進行算法的處理,哪些信息是有用的,哪些是可以過濾的??梢钥吹阶詈蠼?jīng)過訓練之后,這個汽車越來越聰明,越來越知道怎么樣識別網(wǎng)絡里面需要它注意的東西。就像我剛才講到的,這已經(jīng)是14次迭代,經(jīng)過14次卷積網(wǎng)絡的迭代之后,汽車就知道了怎樣應對這個路況。這很好地說明了深度學習架構可以怎么樣被訓練。這里描述了這個訓練的過程,沒有撞對不對。這個汽車一往無前地沿著個路徑行駛,可以看到這個綠色的車自控性非常好、非常簡單,能夠通過多輪的需要和訓練,經(jīng)過不同的計算網(wǎng)絡的運力和卷積網(wǎng)絡適應更加復雜的架構和網(wǎng)絡。
我們在開發(fā)這一系列人工智能應用的時候,我們會考慮不同的框架,包括非常著名的在大學里面進行產(chǎn)學研結合研發(fā)出來的框架,能夠基于這些框架進行自身的應用程序的研發(fā),使用卷積網(wǎng)絡架構來做到這一點。這一系列的AI可以應用到哪些領域呢?我們是否已經(jīng)蓄勢待發(fā)把它用在一些具體的場景里面。我剛才講到了語音識別,包括在社交媒體零售里面的聊天機器人。
我跟大家分享一個故事,就是有一些人會打客服中心,可以看到客服中心的人越來越禮貌、越來越耐心,如果你通過電話撥入,它們會非常耐心,為什么這些客服會這么耐心禮貌?因為它們是客服機器人,而不是真正由人類來做。包括AI也可以應用在自動駕駛之上,這是我們的機構所研究的動向,我們進行了語義識別,使用大規(guī)模的網(wǎng)上課程,包吸引了450萬名線上的學習者。我們希望能夠把這些語義和文本,也就是老師的講課能夠進行自然語言的識別進行字母的翻譯,能夠吸引不同國家的學習者。所以有圖像、有文本,我們可以使用這些自然語言識別來翻譯幫助線上的學習者學習,讓他們能夠自動地了解這些文本的含義,這對于AI的應用來說是非常重要的進步。
我們已經(jīng)很好地把AI和深度學習結合在一起。另外就是醫(yī)療影像社別,一般人看不懂醫(yī)學影像,但是機損級可以幫助我們了解和闡釋這些醫(yī)學影像會帶來什么結果或病癥。這就是基于卷積網(wǎng)絡、層級網(wǎng)絡能夠幫助我們做到的事情。這些使用AI來做,幫助我們節(jié)省能源,可以訓練機器,而不是訓練人。所以我們如果沒有很好地進行訓練,就不能大規(guī)模展開,所以我們需要找到更好的方法進行人工智能深度學習的網(wǎng)絡更好地對結果產(chǎn)出有一個精準的預測。
能夠基于我們有限的資源去做。我們覺得二元網(wǎng)絡可以幫助我們做到這點,我們發(fā)明了多媒體自動化分析,可以使用在很多領域,包括醫(yī)療健康領域,對醫(yī)學影像進行分析,對于CT/PTE掃描以及超聲波儀器進行報告和分析,這樣就能幫助主治醫(yī)生進行判斷。這是腦腫瘤的識別,能夠識別里面的病灶。我們通過機器學習和人工智能的識別更好地進行判定,而不需要過于人工的干預,能夠讓個機器羅列人的病癥和原因,作為輔佐人類的手段。另外是在心臟疾病的應用,中國在這方面的研究已經(jīng)非常領先了,把二元神經(jīng)網(wǎng)絡用在實際的應用場景。尤其是在能源領域的應用使得溫室氣體排放,使得全球氣候變暖,所以我們在機器運轉的時候要注重生態(tài)友好。德國有一句話是綠色IT,我們要評估這些機器不是說它們的功勞有多大,而是能耗是不是非常友好的機器或儀器。
我們設計了一系列的網(wǎng)絡,這個網(wǎng)絡并不是我們之前講到的現(xiàn)在的深度學習網(wǎng)絡所擁有的,但它是基于深度學習的網(wǎng)絡迭代而來的。我們剛才講到的二元神經(jīng)網(wǎng)絡,包括數(shù)學邏輯的分析,還有其他非常復雜的一套生態(tài)系統(tǒng),也有其他多重的應用。
最后我想總結一下,在哈索-普拉特納數(shù)字工程研究院,我們可以記住我們這個研究院的名字,我們學院一直希望能夠更好地收集數(shù)據(jù)進行研究。AI也能夠應用在藝術另面,這是我們的辦公樓,你能夠看到這是研究所主要的樓宇,但是我們希望以油畫的濾鏡效果來呈現(xiàn),這是梵高的星空圖,如果我們把這個星空圖結合到我們實際的大樓里面,就有了以下的效果。其實并不是那么容易,就像換一個濾鏡一樣,我們只要訓練了這個網(wǎng)絡,并且有很好的輸入,輸入原來的藝術作品,同時輸入梵高的藝術作品的參數(shù),結合這兩個照片,網(wǎng)絡會自動學習這個藝術照片和這個照片之間會有什么樣的聯(lián)系,可以看到可以應用到其他照片的再創(chuàng)造里面。謝謝大家的聆聽。