阿里云人工智能小Ai已超越了深度學(xué)習(xí)的范疇?
在了解阿里云人工智能機(jī)器人小Ai的基本運(yùn)作過(guò)程后,筆者認(rèn)為小Ai的算法其實(shí)已經(jīng)不僅是深度學(xué)習(xí),而是在深度學(xué)習(xí)之上的更高階算法,并就此向阿里云人工智能科學(xué)家閔萬(wàn)里求證,得到的回復(fù):是的。
小Ai算法高階在哪里?
盡管阿里云方面沒(méi)有透露關(guān)于小Ai更多算法方面的信息,只說(shuō)小Ai主要基于神經(jīng)網(wǎng)絡(luò)、社會(huì)計(jì)算(social compuTIng)、情緒感知等原理工作,善于洞察本質(zhì)和實(shí)時(shí)預(yù)測(cè),并能理解人類情感。
但是小Ai挑戰(zhàn)歌王預(yù)測(cè)難點(diǎn)有三:首先,這是在7個(gè)歌手之間的混戰(zhàn),并非AlphaGo與李世石之間的兩人對(duì)弈;其次,唱歌是情感理解加藝術(shù)欣賞,不同的唱法、變聲、假聲等無(wú)常法也無(wú)定論,現(xiàn)場(chǎng)演唱更是即興創(chuàng)作;再次,最終結(jié)果是湖南衛(wèi)視節(jié)目組、電視觀眾、500位大眾評(píng)審、7位歌手共同創(chuàng)造的結(jié)果,其中充滿了巨大的隨機(jī)性。
簡(jiǎn)單的理解,用于AlphaGo圍棋對(duì)弈、語(yǔ)音識(shí)別、圖像識(shí)別等的深度學(xué)習(xí)算法,主要解決的是單目標(biāo)優(yōu)化問(wèn)題,而小Ai要挑戰(zhàn)的本質(zhì)上是多目標(biāo)優(yōu)化問(wèn)題,這從根本上就“迫使”阿里云選擇更高階的算法。閔萬(wàn)里告訴記者,小Ai本身是一個(gè)基于概率的決策優(yōu)化過(guò)程,在決策過(guò)程中需要多組變量輸入,其中的部分變量是通過(guò)深度學(xué)習(xí)優(yōu)化得來(lái)。
之前,小Ai的算法已經(jīng)被阿里云成功用于浙江省交通廳的路況預(yù)測(cè),而能解決城市管理和宏觀經(jīng)濟(jì)問(wèn)題的人工智能算法都屬于多目標(biāo)優(yōu)化算法。西方已經(jīng)在城市綜合管理和宏觀政策制定等領(lǐng)域長(zhǎng)期采用了多目標(biāo)優(yōu)化算法,包括模擬退火算法、遺傳算法等。閔萬(wàn)里透露,小Ai并沒(méi)有采用現(xiàn)成的多目標(biāo)優(yōu)化算法,而是自己開發(fā)的算法體系。
小Ai憑什么?
那么,小Ai憑什么能夠?qū)崿F(xiàn)高階算法呢?這必須要提到小Ai之父、阿里云人工智能科學(xué)家閔萬(wàn)里。
14歲被中科大的少年班錄取,閔萬(wàn)里19歲赴美攻讀物理學(xué)碩士,2004年獲得芝加哥大學(xué)統(tǒng)計(jì)學(xué)博士,先后在IBM Watson研究院及Google擔(dān)任研究員,2013年加入阿里云負(fù)責(zé)人工智能項(xiàng)目小Ai。
閔萬(wàn)里說(shuō)在IBM Watson研究院的經(jīng)歷讓他受益匪淺。IBM最早提出智慧城市戰(zhàn)略,也是最早看到未來(lái)趨勢(shì)。2005年,IBM把PC硬件業(yè)務(wù)賣給聯(lián)想后,開始自己的轉(zhuǎn)型。這個(gè)轉(zhuǎn)型的過(guò)程,最缺的就是海量數(shù)據(jù)分析能力,因此補(bǔ)充了很多相關(guān)研究項(xiàng)目,包括海量數(shù)據(jù)分析、關(guān)鍵信息提取、預(yù)測(cè)建模、機(jī)器學(xué)習(xí)等,閔萬(wàn)里也借此接觸了一線實(shí)戰(zhàn)案例。
之后到了Google,閔萬(wàn)里比較具體地負(fù)責(zé)移動(dòng)端廣告精準(zhǔn)推送優(yōu)化研究,主要是對(duì)海量數(shù)據(jù)進(jìn)行研判,這其實(shí)已經(jīng)非常接近今天小Ai要解決的問(wèn)題了。移動(dòng)端廣告精準(zhǔn)推送優(yōu)化是互聯(lián)網(wǎng)廣告最核心的技術(shù),需要通過(guò)大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)等提升廣告的精準(zhǔn)推送,從而提高廣告的點(diǎn)擊率。
移動(dòng)端廣告精準(zhǔn)推送優(yōu)化數(shù)據(jù)分析包括:研判用戶當(dāng)前上下文網(wǎng)頁(yè)的內(nèi)容;研判用戶所在地理位置——駕車狀態(tài)下推送短廣告、飯館里推送復(fù)雜廣告;研判用戶對(duì)于推送廣告的喜愛(ài)程度等。這些都屬于多情景變量下的實(shí)時(shí)決策問(wèn)題,與小Ai要挑戰(zhàn)的歌王預(yù)測(cè)場(chǎng)景極為類似。
閔萬(wàn)里長(zhǎng)期從事機(jī)器學(xué)習(xí)理論研究與應(yīng)用算法研發(fā),在腦電波(EEG)解析、高維數(shù)據(jù)挖掘、隨機(jī)過(guò)程理論、時(shí)間序列分析、網(wǎng)絡(luò)流理論等領(lǐng)域獲得多項(xiàng)國(guó)際專利。他于2011年發(fā)表的道路交通流預(yù)測(cè)研究,是該領(lǐng)域全球五年來(lái)被引用次數(shù)最多的論文之一。
2013年,有獵頭找到閔萬(wàn)里,希望游說(shuō)他加入阿里云。當(dāng)時(shí)獵頭說(shuō)了一句話,中國(guó)有這樣一家公司,數(shù)據(jù)總量比亞馬遜、eBay、Paypal加起來(lái)還多。“這一句話就已經(jīng)可以說(shuō)明一切了,做大數(shù)據(jù)就要來(lái)阿里。”
小Ai的研發(fā)過(guò)程
從2012年開始,阿里云研發(fā)了后來(lái)被稱為“MaxCompute”的海量數(shù)據(jù)處理計(jì)算引擎,當(dāng)時(shí)叫做ODPS,這是小Ai非常重要的計(jì)算基礎(chǔ)設(shè)施。
ODPS是阿里集團(tuán)30多個(gè)事業(yè)部唯一的大數(shù)據(jù)處理平臺(tái),在2015世界Sort Benchmark排序比賽中,ODPS用377秒完成了100TB的數(shù)據(jù)排序,打破了此前Apache Spark創(chuàng)造的1406秒紀(jì)錄,創(chuàng)造了4項(xiàng)世界紀(jì)錄。如今,MaxCompute可在6小時(shí)內(nèi)處理100PB數(shù)據(jù)、相當(dāng)于1億部高清電影。
值得一提的是ODPS的實(shí)時(shí)計(jì)算系統(tǒng)StreamSQL,后來(lái)在阿里云數(shù)據(jù)加平臺(tái)被稱為“StreamCompute”,可日均處理萬(wàn)億消息、PB級(jí)的數(shù)據(jù)以及千萬(wàn)級(jí)的每秒查詢率QPS,適用于根據(jù)用戶實(shí)時(shí)行為數(shù)據(jù)(瀏覽、成交、收藏等)調(diào)整推薦商品的實(shí)時(shí)推薦系統(tǒng)等。
阿里云方面說(shuō),小Ai的學(xué)習(xí)速度是人類的1萬(wàn)倍,人類需要10萬(wàn)小時(shí)成為某一領(lǐng)域的專家,小Ai只需要10小時(shí)。這其實(shí)就是基于MaxCompute和StreamCompute等阿里云大數(shù)據(jù)分析的實(shí)戰(zhàn)平臺(tái),“阿里云的大數(shù)據(jù)分析是經(jīng)過(guò)了實(shí)戰(zhàn)檢驗(yàn),這是與其它平臺(tái)不一樣的地方。”這個(gè)平臺(tái)經(jīng)歷了阿里上萬(wàn)名工程師的實(shí)戰(zhàn),其中包括7次雙十一的考驗(yàn)。
在研發(fā)MaxCompute等計(jì)算平臺(tái)的同時(shí),阿里云人工智能小組還在開發(fā)深度學(xué)習(xí)、社交網(wǎng)絡(luò)情感分析、語(yǔ)意分析、優(yōu)化算法等人工智能算法體系。到2015年的時(shí)候,阿里云的人工智能算法在阿里各個(gè)業(yè)務(wù)場(chǎng)景下實(shí)現(xiàn)了成熟的應(yīng)用,之后被抽象成通用的模塊再嫁接到MaxCompute上。
“所以阿里云的人工智能模塊帶有明確的可應(yīng)用場(chǎng)景,不是閉門造車。也不是我們憋了4年,就為做這件事(挑戰(zhàn)《我是歌手》)。這其實(shí)是在阿里整個(gè)業(yè)務(wù)生態(tài)中,慢慢成長(zhǎng)起來(lái)的。”閔萬(wàn)里說(shuō)。
小Ai的算法體系
阿里云于2012年就開始人工智能領(lǐng)域的技術(shù)研發(fā)和儲(chǔ)備。在參加湖南衛(wèi)視《我是歌手》比賽之前,小Ai已經(jīng)積累了不少實(shí)戰(zhàn)經(jīng)驗(yàn),比如幫助光伏電廠預(yù)估發(fā)電產(chǎn)能減少能耗、幫助水利監(jiān)管部門預(yù)測(cè)水庫(kù)水位以預(yù)防災(zāi)害發(fā)生、幫助金融機(jī)構(gòu)客服人員接電話、幫助阿里音樂(lè)預(yù)測(cè)音樂(lè)黑馬等等。
小Ai團(tuán)隊(duì)除了工程師、科學(xué)家之外,還有多位阿里音樂(lè)和專業(yè)人士作為教練,學(xué)習(xí)了幾百萬(wàn)首歌提升音樂(lè)品味和鑒賞能力。小Ai基于阿里音樂(lè)數(shù)據(jù)庫(kù),自動(dòng)學(xué)習(xí)音頻的重要特征后形成對(duì)歌曲的多維度評(píng)價(jià),包括音高、能量、語(yǔ)譜、基頻等,通過(guò)特征來(lái)訓(xùn)練小Ai對(duì)音頻及受歡迎程度之間的關(guān)聯(lián)性思維,不過(guò)目前小Ai還沒(méi)有遍歷韓文等外文歌曲。
那么小Ai是如何現(xiàn)場(chǎng)預(yù)測(cè)比賽結(jié)果的?小Ai從歷史賽事和海量資料中尋找影響比賽結(jié)果的變量因子,訓(xùn)練出一個(gè)實(shí)時(shí)動(dòng)態(tài)模型進(jìn)行預(yù)測(cè),包括歌曲、歌手、粉絲、現(xiàn)場(chǎng)氛圍、網(wǎng)友討論等維度,每種維度都通過(guò)機(jī)器學(xué)習(xí)提取海量特征。這些特征有靜態(tài)的,也有跟隨比賽而動(dòng)態(tài)變化的,需要現(xiàn)場(chǎng)實(shí)時(shí)計(jì)算。
閔萬(wàn)里透露,小Ai眼里的歌手是無(wú)數(shù)標(biāo)簽的集合,比如李玟就有女歌手、70后、華裔、美國(guó)、偶像、性感、奧斯卡、R&B、Soul、粉絲量等標(biāo)簽。而現(xiàn)場(chǎng)影響評(píng)委喜好的因素非常多,小Ai需要找到這些影響因素的每一個(gè)信息變量,包括歌手演唱相關(guān)的曲風(fēng)、流派、編曲、幫唱嘉賓、舞蹈、歌手顏值等現(xiàn)場(chǎng)熱數(shù)據(jù),以及場(chǎng)外的各種冷數(shù)據(jù)信息。再把這些信息通過(guò)一定邏輯疊加在一起,形成整體決策機(jī)制。
總結(jié)來(lái)說(shuō),小Ai要做的是去觀察一切可能影響投票結(jié)果的因子,整個(gè)過(guò)程是在全空間、連續(xù)、動(dòng)態(tài)地場(chǎng)景中,“理解人類的喜好”、“洞察人類的思考”。
與微軟小冰的區(qū)別
作為同樣主打“情感算法”的微軟小冰,閔萬(wàn)里表示微軟小冰與人類的一問(wèn)一答對(duì)話很容易帶入上下文情境,之后就可以用語(yǔ)言學(xué)等相關(guān)的模型進(jìn)行建模和分析。而小Ai要同時(shí)理解7個(gè)歌手的混戰(zhàn)以及音樂(lè)欣賞等超越語(yǔ)言的內(nèi)容,這是小Ai的不同之處。
閔萬(wàn)里舉例小Ai的算法難點(diǎn),比如上一次的孫楠退賽完全出乎意料,小Ai也不可能預(yù)料到這樣的事件,這對(duì)當(dāng)時(shí)的模型訓(xùn)練造成了很大的困擾。在現(xiàn)場(chǎng)比賽的時(shí)候,什么狀況都有可能發(fā)生,不管最后小Ai預(yù)測(cè)的結(jié)果如何,都是一次成功的嘗試。
此外,在商業(yè)模式方面,小Ai看起來(lái)也不如微軟小冰有一個(gè)比較容易的商業(yè)化路線,現(xiàn)在微軟正把小冰變成整個(gè)微軟產(chǎn)品與服務(wù)的人工智能基礎(chǔ)設(shè)施。與當(dāng)前盛行的深度學(xué)習(xí)算法相比,小Ai的多目標(biāo)優(yōu)化算法似乎也難于看到一個(gè)清晰的商業(yè)化前景。
對(duì)于商業(yè)化模式問(wèn)題,閔萬(wàn)里說(shuō)阿里有一個(gè)戰(zhàn)略:Happiness(幸福)和Health(健康),也就是幸福指數(shù)與健康指數(shù)。小Ai的音樂(lè)和藝術(shù)欣賞能力,既跟幸福指數(shù)相關(guān)也與健康指數(shù)相關(guān),僅僅實(shí)現(xiàn)這一點(diǎn)就已經(jīng)是巨大的技術(shù)成就了。此外,小Ai的能力可以很容易泛化到商業(yè)領(lǐng)域,之前已經(jīng)在交通管理、能源管理、天氣預(yù)測(cè)等成功應(yīng)用。
《我是歌手》第四季總決賽中小Ai的實(shí)時(shí)預(yù)測(cè)嘗試得到了廣泛關(guān)注,IBM也提前為小Ai發(fā)來(lái)了祝愿。更為重要的是,本次預(yù)測(cè)是多目標(biāo)優(yōu)化算法的一次挑戰(zhàn),可以說(shuō)也是在中國(guó)首次被公眾體驗(yàn)。
從此,人工智能揭開了新篇章。