馬維英:人工智能技術(shù)是字節(jié)跳動(dòng)全球化的關(guān)鍵
2018 人工智能大會(huì)于9月17日至19日在上海召開,在“人工智能與實(shí)體經(jīng)濟(jì)深度融合發(fā)展分論壇上,字節(jié)跳動(dòng)副總裁、人工智能實(shí)驗(yàn)室負(fù)責(zé)人馬維英表示,技術(shù)出海是字節(jié)跳動(dòng)全球化發(fā)展的核心戰(zhàn)略,人工智能技術(shù)是字節(jié)跳動(dòng)全球化取得當(dāng)前進(jìn)展的關(guān)鍵。
馬維英稱,字節(jié)跳動(dòng)通過6年發(fā)展,當(dāng)前產(chǎn)品和服務(wù)已經(jīng)覆蓋150多個(gè)國家、75個(gè)語種,在40多個(gè)國家和地區(qū)位居應(yīng)用商店總榜前列。技術(shù)出海,是字節(jié)跳動(dòng)全球化發(fā)展的核心戰(zhàn)略,人工智能技術(shù)是字節(jié)跳動(dòng)全球化取得當(dāng)前進(jìn)展的關(guān)鍵。
在此次論壇上,字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室項(xiàng)目《基于分布式機(jī)器學(xué)習(xí)平臺(tái)的通用人工智能應(yīng)用解決方案》入選2018 國家工信部人工智能與實(shí)體經(jīng)濟(jì)深度融合創(chuàng)新項(xiàng)目。據(jù)了解,該創(chuàng)新項(xiàng)目將是建設(shè)“訓(xùn)練資源服務(wù)平臺(tái)”的主力軍。
以下為馬維英演講全文:
大家好!我是字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室負(fù)責(zé)人馬維英。今天非常高興與大家相聚在上海,共同探討人工智能的發(fā)展及應(yīng)用現(xiàn)狀,以及未來我們?nèi)绾斡肁I賦能新時(shí)代。
首先我們來回顧一下,在整個(gè)人類歷史洪流中,內(nèi)容的創(chuàng)作,信息的傳播和交流,一直是整個(gè)人類社會(huì)的基礎(chǔ)設(shè)施。在大約公元100年前的時(shí)候,蔡倫發(fā)明了造紙術(shù),人們開始用紙張來創(chuàng)作、傳播。紙張和書籍成了人與信息連接的最主要媒介。從一開始,中國就扮演這樣一個(gè)重要的角色,這些關(guān)鍵技術(shù)都是中國發(fā)明的。之后經(jīng)過很長(zhǎng)一段時(shí)間,直到三四十年前,信息的連接方式才有了新的變革。
互聯(lián)網(wǎng)時(shí)代網(wǎng)站、網(wǎng)頁讓紙張消失,成為了我們的數(shù)字圖書館,我們開始使用搜索引擎,一鍵便可以直達(dá)自己的所需。
到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,紙張消失得愈加明顯,因?yàn)樗屝畔o所不在,人類可以隨時(shí)隨地用智能手機(jī)接觸他所需要的信息。而且手機(jī)也變成一個(gè)人的網(wǎng)站,人可以用手機(jī)寫文章、拍攝視頻然后發(fā)布出來,并通過手機(jī)與其他人交流互動(dòng)。原來在PC互聯(lián)網(wǎng)時(shí)代有很多的機(jī)構(gòu)媒體,到今天出現(xiàn)了無數(shù)自媒體,再到每個(gè)人都在創(chuàng)作,每個(gè)人都可以分享他的知識(shí),他的生活的體驗(yàn),他的故事。從OGC、PGC再到UGC,在這個(gè)萬物互聯(lián)的時(shí)代,人與信息的連接可以做到無所不在。字節(jié)跳動(dòng)這家公司就誕生于這樣的時(shí)代。它顛覆了搜索引擎,建立了全新的人與信息的連接方式。
到最近,人工智能時(shí)代到來,也許未來我們還將共同迎接“超級(jí)智能時(shí)代”的機(jī)遇和挑戰(zhàn)。今天有很多人問,那人工智能會(huì)不會(huì)取代人的創(chuàng)作呢?我個(gè)人相信人的想象,人的創(chuàng)作力,人的愛跟關(guān)懷是機(jī)器不可能取代的。所以我相信未來我們會(huì)進(jìn)入一個(gè)人與機(jī)器互相幫助、互相學(xué)習(xí)的時(shí)代。人讓機(jī)器更聰明,但機(jī)器同時(shí)也可以幫助人釋放更多的想象力、創(chuàng)造力,各行各業(yè)都能夠用AI來重新定義我們的產(chǎn)業(yè)。
字節(jié)跳動(dòng)這家公司有幾個(gè)比較重要的產(chǎn)品,第一個(gè)就是大家比較熟悉的今日頭條。它也是在中間連接兩端—;—;一邊是信息的源頭,包含文字、圖片、視頻、直播、問答、AR、VR,它是全信息、全媒體、全內(nèi)容的平臺(tái)。另外一端是人,不單是個(gè)人,我們有興趣小組,有社群。
PC時(shí)代的搜索,沒辦法做到個(gè)性化、社交化、移動(dòng)化、無所不在化。今天我們利用新的技術(shù),重新顛覆。字節(jié)跳動(dòng)一邊讓AI學(xué)習(xí)大量的形式多樣化的理解內(nèi)容,另一邊我們?yōu)槊總€(gè)人建模—;—;根據(jù)每一個(gè)人的興趣愛好和他的使用行為。我們將搜索引擎里所有排序、分析等技術(shù),都用于進(jìn)一步的個(gè)性化精準(zhǔn)推薦,從而變成信息流。信息流是一種新的、更智能的方式,讓人能夠隨時(shí)隨地獲取他所要的信息。這時(shí)候手機(jī)就相當(dāng)于一個(gè)助理,能夠像助理一樣理解他,為他提供他所需要的信息。
過去一兩年,短視頻成為一種在世界范圍內(nèi)最受歡迎的信息生產(chǎn)與消費(fèi)形式。字節(jié)跳動(dòng)旗下短視頻產(chǎn)品的代表抖音也風(fēng)靡全球。
今年一季度,抖音下載量超越Facebook、Youtube、Instagram等,成為全球下載量最高的iPhone應(yīng)用;抖音的全球化布局始于2017年8月,截至目前,抖音海外版TikTok已覆蓋全球150多個(gè)國家,抖音及海外版TikTok全球月活已經(jīng)突破5億。
隨著TikTok在海外接連獲得佳績(jī),抖音已經(jīng)成為中國產(chǎn)品在海外獲得成功的一個(gè)典型,被視作中國移動(dòng)產(chǎn)品出海的新模式。作為一款中國產(chǎn)品,抖音在全世界范圍成了受喜愛的內(nèi)容傳播平臺(tái),我想對(duì)于我們中國文化走出國門影響全世界,抖音應(yīng)該可以發(fā)揮積極的助力作用。
但建立這樣一個(gè)公開、開放的平臺(tái),任務(wù)是非常艱巨的。因?yàn)槊恳晃挥脩舳寄軌蜃约荷蟼鲀?nèi)容,于是我們需要做非常多的事情。我們必須為這些內(nèi)容做審核、分類、查看是否侵犯版權(quán)、做推薦,還要做相似性的搜索,語義的搜索。而這些都離不開人工智能的幫助。
臺(tái)下如果有熟悉抖音的來賓,應(yīng)該會(huì)對(duì)抖音的各種特效、濾鏡、創(chuàng)意玩法印象深刻??梢哉f這些正是這款產(chǎn)品制勝的關(guān)鍵原因之一。而它們都是AI技術(shù)在短視頻中的應(yīng)用。
我們通過人臉和其他人體關(guān)鍵點(diǎn)檢測(cè)與追蹤,可以實(shí)現(xiàn)玩變臉等創(chuàng)意效果,尬舞機(jī)、控雨、控花瓣等等都是抖音非常受歡迎的玩法。我們的視頻切割技術(shù)還能實(shí)現(xiàn)染發(fā)、背景替換等各種效果。
除了應(yīng)用于短視頻產(chǎn)品,字節(jié)跳動(dòng)的人工智能技術(shù)還通過我們的多款產(chǎn)品賦能信息創(chuàng)作與交流的各個(gè)環(huán)節(jié)。
我們通過自然語言理解和自然語言生成,自研了一個(gè)寫稿機(jī)器人。xiaomingbot寫作機(jī)器人獲得了吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)。小明能夠自動(dòng)寫作,特別是一些垂直領(lǐng)域,像體育、房產(chǎn)、汽車、天氣等相關(guān)的新聞,小明可以每天產(chǎn)生新聞播報(bào)。
相比于人類作者,小明的效率和產(chǎn)量高。一個(gè)體育比賽結(jié)束之后兩秒鐘,我們的自動(dòng)轉(zhuǎn)播,自動(dòng)寫作的報(bào)導(dǎo)就上線了。過去一段時(shí)間小明已經(jīng)有了幾萬粉絲,他寫的東西獲得了幾十億次閱讀。小明寫作還支持很多的語言,除了中文之外,有英文,和其他的語言。那下一個(gè)就讓大家看一下小明的工作基本原理。他其實(shí)分析了多種數(shù)據(jù)源頭包含的文本、圖片、視頻。
大家現(xiàn)在看的是2018年世界杯中比利時(shí)對(duì)日本的那場(chǎng)比賽??梢钥吹?,小明能實(shí)時(shí)對(duì)這個(gè)視頻做理解,通過視覺識(shí)別球員和他背后的編碼,自動(dòng)生成描述文本。例如“某某球員在某個(gè)時(shí)間進(jìn)球”。
自動(dòng)寫作體育新聞可以實(shí)現(xiàn)體育轉(zhuǎn)播千人千面。每個(gè)人你可以看你喜歡的球員,而不是說每個(gè)人獲取的報(bào)導(dǎo)都一樣。你可以專注你想專注的球隊(duì)或球員,而且我可以把這個(gè)球員立體的信息,他的勝負(fù)率,他本賽季表現(xiàn)如何,容納到你看到的報(bào)導(dǎo)里面。
我們?nèi)虻挠脩裘刻靹?chuàng)造出海量?jī)?nèi)容,這意味著什么呢,意味著同時(shí)我們的審核任務(wù)和壓力是巨大的。為此我們建立了600多個(gè)審核模型,擁有近億條數(shù)據(jù)的龐大數(shù)據(jù)庫。人工智能輔助審核需不僅要對(duì)文字、圖片做識(shí)別,還要識(shí)別語音、視頻。有時(shí)候視頻看的沒有問題,但語音有問題,語音我們也需要轉(zhuǎn)成文字,進(jìn)一步再識(shí)別。這些圖像、文字、視頻識(shí)別模型經(jīng)過訓(xùn)練,可以大大提高審核的自動(dòng)化程度。
人工智能加上我們的審核人員就形成閉環(huán),AI是我們?yōu)閷徍巳藛T訓(xùn)練出來的工具。同時(shí),審核團(tuán)隊(duì)在工作中提供了很多標(biāo)注,監(jiān)督式機(jī)器學(xué)習(xí)可以使用這個(gè)大數(shù)據(jù)來訓(xùn)練自動(dòng)視頻理解系統(tǒng)。而訓(xùn)練后的系統(tǒng)再給審核人員用,那他們就能更高效地審核,并且能提供更多的反饋和新的標(biāo)注數(shù)據(jù)。所以人和機(jī)器是共同學(xué)習(xí)的,機(jī)器幫人,人又幫機(jī)器,形成正向循環(huán),不斷地迭代大數(shù)據(jù)。
目前我們的人工智能大概為公司節(jié)省了十萬級(jí)別的人力。如果沒有人工智能輔助審核,那我們的審核團(tuán)隊(duì)人數(shù)就將是現(xiàn)在的很多倍。我們也有計(jì)劃把這些數(shù)據(jù)能夠標(biāo)準(zhǔn)化和公開,也可以搞競(jìng)賽,讓學(xué)術(shù)界更多的研究人員能夠利用這些數(shù)據(jù)來做研究。
這就是我們一直在努力做的事—;—;建設(shè)新一代人工智能驅(qū)動(dòng)的信息平臺(tái),連接人和信息,從內(nèi)容創(chuàng)作、過濾、審核、分發(fā)、搜索、消費(fèi)以及互動(dòng)的每個(gè)環(huán)節(jié),促進(jìn)創(chuàng)作和交流。
從圖上我們可以看到,從信息的創(chuàng)作端的創(chuàng)作者,到信息消費(fèi)端的讀者,每一個(gè)中間人與信息連接的都是一個(gè)信息流。字節(jié)跳動(dòng)建設(shè)這個(gè)這個(gè)人工智能的基礎(chǔ)設(shè)施+服務(wù)平臺(tái),可以支撐整個(gè)公司數(shù)據(jù)的處理、分析、挖掘、理解、組織。同時(shí)又能讓人工智能進(jìn)一步學(xué)習(xí)這里面每一個(gè)環(huán)節(jié)的語義表達(dá)方式。
未來整個(gè)社會(huì)要從數(shù)字化進(jìn)一步走到智能化表達(dá)。今天人工智能可以用來學(xué)習(xí)從數(shù)字表達(dá)到語義表達(dá)的轉(zhuǎn)換,因?yàn)閿?shù)字化之后還不夠,計(jì)算機(jī)無法直接理解, 人工智能學(xué)習(xí)語義表達(dá)全世界,在那個(gè)空間里計(jì)算機(jī)的能力就可以發(fā)揮。用向量計(jì)算加加減減就知道圖像里面是什么,加加減減就知道它的內(nèi)容能產(chǎn)生什么樣的情感,是悲傷、是快樂,是害怕,對(duì)內(nèi)容有產(chǎn)生情感的認(rèn)知。
我們也希望這樣一個(gè)新一代的人工智能驅(qū)動(dòng)的信息平臺(tái)建設(shè)完成之后我們能夠進(jìn)一步去賦能,能夠?qū)ν馊ポ敵鲞@些能力,能夠幫助其他的企業(yè),能夠利用AI去賦能更多行業(yè)和應(yīng)用場(chǎng)景,可以是醫(yī)療、教育、財(cái)經(jīng)、媒體,或者說一些新的內(nèi)容,例如說垂直的應(yīng)用。
為了實(shí)現(xiàn)我們的這些構(gòu)想,用人工智能賦能新時(shí)代,我們字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室一直在不斷鉆研探索。我們目前主要的研究領(lǐng)域包括機(jī)器學(xué)習(xí)、自然語言理解、計(jì)算機(jī)視覺、人機(jī)交互與機(jī)器人等方向,我們實(shí)驗(yàn)室有一群國內(nèi)外一流高校畢業(yè)的科學(xué)家以及擁有多年一線機(jī)器學(xué)習(xí)應(yīng)用開發(fā)經(jīng)驗(yàn)的工程師團(tuán)隊(duì),一起專注人工智能領(lǐng)域的前沿技術(shù)研究,一同攻關(guān)克難。
和歷次工業(yè)革命一樣,我們?nèi)缃襁~入人工智能時(shí)代,是人類社會(huì)了不起的進(jìn)步。而技術(shù)的進(jìn)步最終是服務(wù)于人類的。我們鉆研技術(shù)不僅是鉆研技術(shù)本身,更重要的是研究如何用它來解決人類社會(huì)的難題。
幾年前,我們就開始將人工智能結(jié)合產(chǎn)品功能積極服務(wù)于公益。比如借由我們的精準(zhǔn)推送,根據(jù)他的走失時(shí)間、地點(diǎn),把走失者的信息推送給這些可能有信息線索的人。目前整個(gè)頭條尋人,已經(jīng)找到了超過7000人,應(yīng)該是中國尋人機(jī)構(gòu)找回走失者最多的,平均每天至少找到10位,最多的時(shí)候一天找回29位。我們還幫助很多臺(tái)灣老兵找到了大陸的親人,幫助51個(gè)家庭跨越海峽兩岸團(tuán)聚。
我們還利用技術(shù)去實(shí)現(xiàn)精準(zhǔn)扶貧,讓四川省古藺縣、甘肅省夏河縣、貴州省雷山縣的山貨走上頭條,盤活優(yōu)質(zhì)文化物質(zhì)資源,服務(wù)國家鄉(xiāng)村振興戰(zhàn)略。
在教育方面,我們也認(rèn)為AI有機(jī)會(huì)幫助教育。因?yàn)槲覀兛梢杂萌斯ぶ悄芗夹g(shù)來連接有教育資源的人跟需要教育資源的人。我們可以用AI技術(shù)把最好的師資、最好的教材傳遞到偏遠(yuǎn)地區(qū)。像我們的“益童樂園”貴州起航,“鄉(xiāng)村AI教師”也全面建成,我們希望讓貧困地區(qū)的孩子也接受到良好的教育。
基于我們前面提到的種種嘗試與努力,字節(jié)跳動(dòng)的愿景也正在逐步實(shí)現(xiàn)—;—;建設(shè)全球創(chuàng)作與交流平臺(tái)。公司成立至今六年以來,我們的產(chǎn)品和服務(wù)已經(jīng)覆蓋150多個(gè)國家、75個(gè)語種,在40多個(gè)國家和地區(qū)位居應(yīng)用商店總榜前列。而這背后,正是科技和創(chuàng)新在推動(dòng)我們?nèi)蚧陌l(fā)展。技術(shù)出海,是字節(jié)跳動(dòng)全球化發(fā)展的核心戰(zhàn)略,人工智能技術(shù)是字節(jié)跳動(dòng)全球化取得當(dāng)前進(jìn)展的關(guān)鍵。作為人工智能時(shí)代的中國創(chuàng)業(yè)者,未來字節(jié)跳動(dòng)將繼續(xù)孜孜以求,幫助全世界的用戶更好地創(chuàng)作、交流、互動(dòng),也為中國人工智能的發(fā)展貢獻(xiàn)一份力量!
謝謝大家!