美團(tuán)推出語(yǔ)音新技術(shù),可幫助盲人點(diǎn)外賣(mài)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
(文章來(lái)源:經(jīng)濟(jì)觀察報(bào))
10月14日,美團(tuán)宣布,將于明日,10月15日“國(guó)際盲人節(jié)”上線“美團(tuán)語(yǔ)音盲人定制應(yīng)用”。在美團(tuán)APP內(nèi),1700萬(wàn)盲人群體可以更便捷點(diǎn)外賣(mài)。美團(tuán)語(yǔ)音團(tuán)隊(duì)也于10月14日正式亮相,這是一支100多人的團(tuán)隊(duì),成立于2017年,主要研發(fā)基于生活服務(wù)的語(yǔ)音交互方案和產(chǎn)品。
作為生活服務(wù)平臺(tái),美團(tuán)為何要研究語(yǔ)音技術(shù)?為何將視障人群點(diǎn)外賣(mài)作為重要研究方向?美團(tuán)聯(lián)合創(chuàng)始人、高級(jí)副總裁王慧文在現(xiàn)場(chǎng)表示,一些新技術(shù)剛出現(xiàn)的時(shí)候,有一些人會(huì)因?yàn)椴缓糜枚挥谩<夹g(shù)的落地,需要找到對(duì)技術(shù)有更強(qiáng)烈需求的人群。
對(duì)于盲人群體,語(yǔ)音技術(shù)是一種強(qiáng)烈需求。美團(tuán)一份面向盲人的抽樣調(diào)查顯示,有87%的盲人曾點(diǎn)過(guò)外賣(mài),40%的盲人會(huì)選擇外賣(mài)作為解決三餐的主要方式之一,其中超70%的用戶(hù)會(huì)選擇手機(jī)App來(lái)訂外賣(mài)。美團(tuán)語(yǔ)音負(fù)責(zé)人蔡勛梁介紹,此前,盲人通過(guò)手機(jī)上的讀屏模式點(diǎn)外賣(mài),這種方式“不好用,湊活著也能用?!?/p>
2年時(shí)間內(nèi),美團(tuán)語(yǔ)音團(tuán)隊(duì)從點(diǎn)牛奶開(kāi)始研發(fā),到現(xiàn)在正式推出盲人定制應(yīng)用,產(chǎn)品在盲人群體中實(shí)驗(yàn)多次。美團(tuán)首席科學(xué)家、大數(shù)據(jù)與算法部負(fù)責(zé)人張錦懋稱(chēng),初期,即使語(yǔ)音點(diǎn)牛奶這樣一件簡(jiǎn)單的小事,也花了團(tuán)隊(duì)兩三個(gè)月時(shí)間,并且實(shí)驗(yàn)結(jié)果不令人滿(mǎn)意。
語(yǔ)音點(diǎn)外賣(mài)的難點(diǎn)在于,一開(kāi)始就是語(yǔ)音技術(shù)上的“皇冠”級(jí)難題,“語(yǔ)音完成生活服務(wù),與語(yǔ)音點(diǎn)首歌相比,天然是一個(gè)復(fù)雜的、多任務(wù)的復(fù)雜過(guò)程?!?/p>
張錦懋距離說(shuō),比如點(diǎn)外賣(mài)時(shí)提出想吃某某東西,語(yǔ)音會(huì)有幾十種表達(dá)方式,而點(diǎn)歌,一般只有幾種表達(dá)方式。并且,用戶(hù)對(duì)生活服務(wù)的結(jié)果有更明確的確定性要求,“Siri可以在回答‘你多大了’的問(wèn)題時(shí),抖機(jī)靈說(shuō)這是個(gè)秘密。用戶(hù)問(wèn)最近最好吃的餐廳,你不可能抖機(jī)靈說(shuō)是個(gè)秘密。”
生活服務(wù)語(yǔ)音需求中,每一個(gè)交互都是多輪對(duì)話(huà)問(wèn)題。這也需要長(zhǎng)期投入的技術(shù)耐心。在美團(tuán)同時(shí)擔(dān)任CTO的王慧文承認(rèn),語(yǔ)音技術(shù)方向的人才成本很高,100多人的團(tuán)隊(duì),兩年時(shí)間的研究并沒(méi)有產(chǎn)生直接的很大商業(yè)價(jià)值。不過(guò)他認(rèn)為,這個(gè)技術(shù)持續(xù)迭代,未來(lái)商業(yè)價(jià)值很大。
相對(duì)于其他AI公司的語(yǔ)音識(shí)別技術(shù),美團(tuán)的語(yǔ)音技術(shù)與實(shí)際應(yīng)用聯(lián)系更近。此次上線盲人定制應(yīng)用,美團(tuán)將語(yǔ)音技術(shù)與外賣(mài)結(jié)合,可以幫助1700萬(wàn)盲人點(diǎn)外賣(mài)。王慧文認(rèn)為,美團(tuán)的語(yǔ)音技術(shù)基于生活服務(wù),有了具象場(chǎng)景的應(yīng)用,是科研型和應(yīng)用型結(jié)合的場(chǎng)景,技術(shù)難度其實(shí)是降低了。這有利于語(yǔ)音技術(shù)的更早落地。