“小冰”脫離象牙塔:那個(gè)最不像AI的語(yǔ)音助手創(chuàng)業(yè)了
眾所周知,小冰誕生于 2014 年,是微軟旗下的對(duì)話機(jī)器人。和普遍意義上的問(wèn)答機(jī)器人不同的是,小冰從誕生之初就瞄準(zhǔn)‘有情感、會(huì)閑聊’的方向,主打情感計(jì)算。
7月13日,微軟中國(guó)發(fā)布官方公告,宣布將人工智能小冰業(yè)務(wù)分拆為獨(dú)立公司運(yùn)營(yíng),并委任沈向洋博士為新公司董事長(zhǎng),傳聞近一個(gè)月的微軟小冰分拆終于敲定。
誰(shuí)是小冰?
近年來(lái)小冰出現(xiàn)在公眾視野中,常常是因?yàn)槠淅L畫(huà)、詩(shī)歌、音樂(lè)等藝術(shù)方面的創(chuàng)作。在剛剛閉幕的上海世界人工智能大會(huì)上,小冰還和小米小愛(ài)同學(xué)、百度小度、虛擬主播泠鳶共同演唱了主題曲。
小冰是一個(gè)國(guó)際化的‘AI being’。誕生于中國(guó),2015 年推出日本小冰(りんな),2016 年推出美國(guó)小冰(Zo)。2017 年,在第五代微軟小冰產(chǎn)品發(fā)布會(huì)上,微軟宣布已分別于 2 月和 8 月推出了印度小冰(Ruuh)和印度尼西亞小冰(Rinna)。如今,小冰已經(jīng)進(jìn)化到第七代。
官方數(shù)據(jù)顯示,全球范圍內(nèi),小冰已覆蓋 6.6 億在線用戶、4.5 億臺(tái)第三方智能設(shè)備和 9 億內(nèi)容觀眾。更為重要的是,小冰以其閑聊的特質(zhì),與用戶的單次平均對(duì)話輪數(shù)(CPS)達(dá)到 23 輪,這對(duì)于當(dāng)下的語(yǔ)音人工智能來(lái)說(shuō),是非常高的數(shù)字。
小冰的用戶覆蓋主要來(lái)自合作伙伴的設(shè)備搭載及應(yīng)用搭載,其中包括華為、OPPO、vivo、小米等手機(jī)或音箱等硬件設(shè)備,以及 QQ、微博等應(yīng)用程序。另外,小冰也曾嘗試進(jìn)入垂直產(chǎn)業(yè)。去年,其發(fā)言人曾表示,微軟小冰已經(jīng)完成了金融、地產(chǎn)、紡織、服裝、出版、媒介等十個(gè)行業(yè)的商業(yè)化落地和布局。
2019 年 7 月 14 日 北京 中央美術(shù)學(xué)院美術(shù)館舉辦微軟人工智能小冰‘個(gè)人繪畫(huà)展’《或然世界》這是國(guó)內(nèi)首個(gè)人工智能的個(gè)人畫(huà)展 | 視覺(jué)中國(guó)
企查查信息顯示,拆分后的新主體名為‘北京紅棉小冰科技有限公司’,法定代表人李笛,大股東李明占股 70%,他僅有‘紅棉小冰’一家關(guān)聯(lián)公司。沈向洋任董事長(zhǎng),在工商信息中體現(xiàn)為執(zhí)行董事,目前并不占股。
和小冰從微軟‘解綁’類(lèi)似,6 月,字節(jié)跳動(dòng)旗下 Tiktok 也在接受類(lèi)似的挑戰(zhàn)。在美國(guó)的持續(xù)監(jiān)管壓力下,字節(jié)跳動(dòng)正一步步將海外業(yè)務(wù)剝離國(guó)內(nèi)母體,以完全獨(dú)立的方式運(yùn)營(yíng)。對(duì)小冰而言,脫離母體,拿掉‘外籍’身份,或許是小冰在中國(guó)及東亞進(jìn)行本土商業(yè)化的前提。
語(yǔ)音是不是未來(lái)
在微軟內(nèi)部,并行著兩個(gè)對(duì)話人工智能團(tuán)隊(duì),一個(gè)是小冰,一個(gè)是 Cortana。2019 年底,微軟曾發(fā)表聲明稱,將于 2020 年叫停 Cortana 語(yǔ)音助手在中國(guó)區(qū)的使用。不過(guò),該聲明中提到的撤出國(guó)家除中國(guó)外還包括英國(guó)、澳大利亞、德國(guó)、墨西哥、西班牙、加拿大和印度。
一邊大范圍關(guān)停 Cortana,另一邊拆分小冰品牌,微軟對(duì)語(yǔ)音人工智能助手的態(tài)度可見(jiàn)一斑。在人工智能技術(shù)的三個(gè)主要方向——語(yǔ)音語(yǔ)義、圖像,以及決策中,語(yǔ)音是最早落地的一個(gè),在小冰誕生后一兩年,產(chǎn)業(yè)中出現(xiàn)了智能音箱熱潮,這主要來(lái)自于語(yǔ)音技術(shù)的成熟。
對(duì)于一個(gè)語(yǔ)音人工智能助手來(lái)說(shuō),與人類(lèi)的交流需要經(jīng)過(guò)四個(gè)階段。語(yǔ)音識(shí)別,即將聲音轉(zhuǎn)換成文字;語(yǔ)義理解,也即 NLP 技術(shù),理解人類(lèi)的意圖;結(jié)果生成,即搜索答案,生成回復(fù);以及語(yǔ)音合成,即 TTS 技術(shù),將答案轉(zhuǎn)化為聲音。
在上述四個(gè)步驟中,一和四已經(jīng)成熟,二和三還需時(shí)日。NLP 技術(shù)被稱為人工智能皇冠上的明珠,對(duì)于漢語(yǔ)這樣復(fù)雜的語(yǔ)種來(lái)說(shuō),更是難上加難。目前想要人工智能助手像真實(shí)人類(lèi)一樣與人交流,效果仍舊不能令人滿意。這也是為什么很多人工智能被稱為人工智障的原因。
盡管業(yè)內(nèi)聲音持續(xù)向好,但語(yǔ)音人工智能的商業(yè)化進(jìn)程卻非常緩慢。最廣泛的聲音是,語(yǔ)音是未來(lái)的人機(jī)交互入口,用戶的訴求將通過(guò)聲音與智能設(shè)備交互,甚至一度涌現(xiàn)出‘語(yǔ)音辦公’的熱潮。這在潮水退去的今天看來(lái),是一件非?;闹嚨氖隆?
文字交流在承載信息之上具有保密的特性,而語(yǔ)音天然嘈雜。包括 Siri 在內(nèi)的語(yǔ)音助手長(zhǎng)期承擔(dān)著‘被調(diào)戲’和簡(jiǎn)單輔助功能的角色,使用率低、場(chǎng)景有限制等等問(wèn)題一直難以解決。在這樣的大背景下,微軟對(duì)語(yǔ)音人工智能助手的判斷是否仍像 2014 年當(dāng)時(shí)一樣充滿熱忱,答案大概率是否定的。
不過(guò)盡管語(yǔ)音不會(huì)成為廣泛的人機(jī)交互入口,在陪伴機(jī)器人以及服務(wù)機(jī)器人等特定場(chǎng)景下,仍舊是剛需。語(yǔ)音語(yǔ)義作為人機(jī)交互的基石,其不可替代性不言自明,只是在其中進(jìn)行多少投入,是微軟作為商業(yè)公司需要計(jì)算的事。
拆分后的公司董事長(zhǎng)沈向洋 他是美國(guó)國(guó)家工程院外籍院士 前微軟全球執(zhí)行副總裁 2019年辭職后受聘清華大學(xué)高等研究院雙聘教授 | 極客公園
小冰脫離象牙塔
在微軟內(nèi)部,小冰是一個(gè)無(wú)需負(fù)擔(dān)營(yíng)收 KPI 的存在,科研屬性大于商業(yè)屬性,這也是為什么團(tuán)隊(duì)將小冰的市場(chǎng)推廣重點(diǎn)放在‘琴棋書(shū)畫(huà)’而非落地場(chǎng)景的原因。
此次分拆之后,小冰需要以一個(gè)獨(dú)立的商業(yè)公司的形式運(yùn)營(yíng),對(duì)于團(tuán)隊(duì)來(lái)說(shuō)將會(huì)構(gòu)成一個(gè)挑戰(zhàn)。NLP 技術(shù)難,小冰之所以成為小冰所需要的情感計(jì)算技術(shù)更是處在初級(jí)階段。對(duì)于客戶來(lái)說(shuō),這樣一個(gè)能陪聊會(huì)唱歌的聊天機(jī)器人是否是剛需,需要畫(huà)一個(gè)問(wèn)號(hào)。這樣一來(lái),對(duì)于拆分后的團(tuán)隊(duì)來(lái)說(shuō),融資至關(guān)重要。
拆分前,小冰團(tuán)隊(duì)分布在北京、蘇州、東京三個(gè)辦公室,約 200 余人,拆分后保留 50 余人,在人工智能領(lǐng)域,是一個(gè)小型初創(chuàng)公司的規(guī)模。剛剛離開(kāi)微軟的沈向洋坐鎮(zhèn),李笛領(lǐng)銜,團(tuán)隊(duì)依舊星光熠熠。
對(duì)于這家科研型的小型初創(chuàng)公司來(lái)說(shuō),有世界一流的人才和技術(shù),他們需要的是資金入場(chǎng),和它一起等待人機(jī)交互的新未來(lái)。分拆后的小冰已經(jīng)吸引到一批投資人,新公司估值在 7 億美元。接受財(cái)新網(wǎng)采訪的投資人表示,是否入股仍在考慮,主要是在衡量其商業(yè)化效率。