沒有了深度學(xué)習(xí),機器人只是一堆廢鐵
事實上,在國內(nèi)人工智能還處于非常初級的階段。
昨天,網(wǎng)易發(fā)布的《2016全球人工智能發(fā)展報告》顯示,美國、英國和中國占有全球人工智能企業(yè)數(shù)量的65.73%,而中國以15745件專利居全球人工智能專利數(shù)排名第二。
從谷歌阿法狗大戰(zhàn)李世石到優(yōu)必選機器人春晚群舞,“人工智能”這個詞漸漸被大眾熟知,各種以機器人命名的公司、長相各異的無人機和擺在商場里給孩子當(dāng)搖搖車玩的VR產(chǎn)品,給人描繪出一副好萊塢科幻式的烏托邦生活。
從本月12日開始的雙創(chuàng)周活動,再次炒火了深圳的創(chuàng)業(yè)文化,庫克也專程趕來,你們的深圳又在朋友圈刷屏了:“深圳再次吸引了世界的眼光”、“世界上最聰明的頭腦都在趕往深圳”好像要告訴全世界,這才是宇宙的中心。
這兩天借著參展機會,去主會場溜達兩天。不出所料,現(xiàn)場展出最多的產(chǎn)品是機器人、無人機和AR/VR眼鏡。從外觀上看,似乎這些產(chǎn)品都很酷炫,為了搞清行業(yè)發(fā)展水平并找出幾家能讓人驚叫的產(chǎn)品,我挨個跟人請教了各家產(chǎn)品的性能和產(chǎn)業(yè)化方向。
得出的結(jié)論是,好像沒你們說的那么牛逼啊。。。
我看見的更多是三五歲小童把玩唱《小蘋果》的“小曼”愛不釋手——比不會唱歌的玩具挖掘機好玩多了;也看見當(dāng)時火爆一時的送餐機器人,不知道她怎么在現(xiàn)如今狹小餐廳里穿梭的;還看見被觀眾團團圍住巡邏機器人“小明”無法避障,左右為難,當(dāng)我問旁邊技術(shù)員,巡邏機器人如何識別小偷和業(yè)主時,他笑著對我呵呵。
眾所周知,人工智能的核心是機器學(xué)習(xí),當(dāng)然現(xiàn)在更主流的是深度學(xué)習(xí),通過數(shù)據(jù)訓(xùn)練出模型,并使用模型發(fā)出預(yù)測。這是機器的基本“教化”原理。借助海量大數(shù)據(jù)對其進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,讓一坨冰冷的金屬或塑料具備了智慧,說起來挺爽的,那么問題就來了,這里面涉及到三個層面的問題。
首先,什么是大數(shù)據(jù)?哪些大數(shù)據(jù)有利用價值?如何對這些大數(shù)據(jù)進行分揀處理?我們需要把什么東西塞進機器人大腦?這是人工智能的前提吧,如果沒有運營商海量的四川話、弗蘭話等各式方言的大數(shù)據(jù)庫供給,科大訊飛的語音識別還如何識別?只聽得懂普通話的機器人“小萌”如何能聽得懂說河南話的主人。
其次,機器如何獲取指令?這就涉及到人機交互這樣老生常談的一個問題了。常用的有語音識別、圖像識別以及文字識別,機器通過識別語音、圖像或者文字來對計算中樞發(fā)出計算指令。有人會說,這很簡單啊,就是說句話讓它能聽懂唄!其實并不那么簡單,單拿中文來說,整個中國有不下上百種方言吧,沒種方言發(fā)音標(biāo)準(zhǔn)不一樣吧,每個人的吐字不一樣清晰吧,要讓他聽懂,其實很難,不是一般的難!
當(dāng)然,最后還得說說最核心的模型搭建或者叫網(wǎng)絡(luò)神經(jīng)訓(xùn)練。神經(jīng)訓(xùn)練就是讓機器得到指令后,經(jīng)過計算得出結(jié)果,并輸出指令的過程。高中數(shù)學(xué)老師老教我們,如果A=1,則……;如果A=2,則……,這種根據(jù)變量得出不同結(jié)果的模型是最基礎(chǔ)的算法。
舉個栗子,昨晚看完雙創(chuàng)展,在軟產(chǎn)工作的徒弟小何約我吃飯,這次她又遲到了。我把過往跟小何約飯的經(jīng)歷在腦海中重現(xiàn)一下,看看跟她約飯的次數(shù)中,遲到占了多大的比例。我利用這來預(yù)測她這次遲到的可能性。如果這個值超出了我心里的某個界限,那我選擇等一會再出發(fā)。假設(shè)我跟小何約過5次,她遲到的次數(shù)是1次,那么她按時到的比例為80%,80%是我跟她約飯的我是否按時出發(fā)的標(biāo)準(zhǔn)線,如果小何在5次遲到的次數(shù)中占了4次,也就是她按時到達的比例為20%,由于這個值低于我的紅線,因此我選擇推遲出門的時間。這種模型就是機器的靈魂,而算法也就當(dāng)然成了關(guān)鍵,所以做搜索引擎公司具有天然的算法優(yōu)勢、不管是特斯拉上的無人駕駛還是手機度娘界面上的新聞推送。
由各種人機交互識別技術(shù),對機器發(fā)出指令,機器根據(jù)已有的網(wǎng)絡(luò)神經(jīng)(計算模型)計算出一個結(jié)果,然后對機器硬件發(fā)出執(zhí)行指令,這是機器人工作的基本原理。
復(fù)習(xí)了一遍機器學(xué)習(xí)的基本原理后,反觀你們所展出的機器人,喊一聲“小花”——喚醒機器、唱首歌——錄制好的《小蘋果》就開始唱了,巡邏機器人用得是攝像頭避障,后面沒有人臉圖像大數(shù)據(jù)庫支撐,捕捉到的數(shù)據(jù)將無從匹配,它就變成了一個移動攝像機了,請問現(xiàn)如今三步一臺階的小區(qū),“小花”如何給你巡邏呢?!
現(xiàn)在層出不窮的機器人,根據(jù)用途不同,大致可分為工業(yè)機器人、娛樂型機器人、陪伴型機器人還有保姆式機器人,除了工業(yè)機器人手臂能重復(fù)簡單機械的工作,需要與人交互的機器人很難單獨達到功用,當(dāng)然很重要一方面是人很難對一個不完全智能的東西維持長久的新鮮感,比如只會執(zhí)行唱歌、跳舞和簡單對話機器人,你可能三天就會不再對她有興趣。
當(dāng)然,人工智能技術(shù)積累已經(jīng)到了窗口期,不管目前發(fā)展?fàn)顩r如何,前景是光明的。私以為,單就機器人來說,在目前的技術(shù)積累下,要大面積產(chǎn)業(yè)化還有些困難,唯一有希望的就是將目前人工智能技術(shù)與智能硬件的結(jié)合,不能全智能化的時候,我們將已有技術(shù)與現(xiàn)有硬件結(jié)合,提高現(xiàn)有硬件的各方面性能,是目前人工智能市場化的最好選擇。
拿駕駛來說,如果將計算機視覺技術(shù)與汽車結(jié)合,行駛在馬路上的汽車感應(yīng)到前方可能出現(xiàn)危險時,給駕駛員發(fā)出警示?;蛘哒Z音識別植入到汽車控制中樞中,在高速行駛的汽車上,通過語音對汽車發(fā)出導(dǎo)航,這樣是不是更安全一些,當(dāng)然,很多汽車廠商已經(jīng)在這方面試水,有的已經(jīng)成熟,這也是人工智能目前產(chǎn)業(yè)化的一個范例。
《星球大戰(zhàn)》里面場景終會出現(xiàn),只不過,現(xiàn)在說“保姆式機器人”,我只能說:呵呵。