谷歌語音助手副總裁講述開發(fā)故事,挑戰(zhàn)Alexa不容易
谷歌工程師斯科特·哈夫曼(Scott Huffman)在550英尺的高空俯視拉斯維加斯的天際線。那是一月初一個陽光明媚的下午,而谷歌來這兒是為了在世界最大的技術(shù)展覽會——消費(fèi)電子產(chǎn)品大展(CES)上打響營銷閃電戰(zhàn)——吹捧谷歌助手,一款可以控制智能恒溫器、獲取用戶航班信息和閱讀頭條新聞的數(shù)字軟件。
這款智能助手的工程副總裁哈夫曼正同我站在豪客摩天輪上一個巨大的玻璃球里。這是罪惡之城版的倫敦眼觀光艙,而我們剛剛到達(dá)了摩天輪的頂點(diǎn)。往下看,可以看到谷歌助手的喚醒語“Hey, Google”,巨大的字母貼在拉斯維加斯會議中心大樓上。這句話的一部分被另一建筑物的戶外框架擋住了,使標(biāo)語看起來像是在說“Hey, Go”。
談及智能助手,對于谷歌來說“Go”似乎是其堅定不移的理念,進(jìn)而,這也是個合適的標(biāo)語。自從三年前谷歌首席執(zhí)行官桑德爾·皮查伊(Sundar Pichai)發(fā)布了該軟件以來,這家搜索巨頭就一直致力于追趕亞馬遜的智能助理Alexa。2014年Alexa擊敗谷歌進(jìn)入市場,現(xiàn)在,已是一個家喻戶曉的名字。許多人認(rèn)為這是谷歌才做得出來的產(chǎn)品,并且谷歌的宗旨又是賦予互聯(lián)網(wǎng)搜索與使用之功能。
谷歌要想取得勝利,還得加把勁
研究公司eMarketer的數(shù)據(jù)顯示,亞馬遜旗下由Alexa支持的Echo設(shè)備擁有智能語音助手市場將近70%。而運(yùn)作谷歌助手的Google Home Devices只占據(jù)不到四分之一的市場份額。另一家研究公司Canalys預(yù)測,到2023年,谷歌可能會從亞馬遜手上奪走皇冠。
哈夫曼稱,“如果搶不到市場份額,谷歌助手就沒用了。因此在過去幾年里,我們花了很多精力研發(fā)改良Assistant?!?/p>
倘若詢問大多數(shù)人他們用Assistant或Alexa做什么,他們也許會說,語音助手非常適合播放歌曲、設(shè)置廚房計時器,連接到智能設(shè)備開燈關(guān)燈。這些很好,但谷歌想要實現(xiàn)更多的功能來打敗亞馬遜。過去一年,谷歌和Assistant的發(fā)展軌跡一直處于科幻小說的水平。從現(xiàn)在開始,谷歌只會越來越有抱負(fù)。
谷歌憑借其核心的機(jī)器學(xué)習(xí)、自然語言處理和人工智能,雄心勃勃地引入了新功能,即Duplex項目。谷歌希望做出一個模擬人聲的機(jī)器人,可以幫人安排約會,同時希望Assistant能內(nèi)置27種語言,實時為用戶翻譯對話。
“但是,如果人工智能是讓我們與眾不同之處,那么用它來真正革新人們生活方式的功能是什么?”我這樣問哈夫曼是因為我希望廣闊的環(huán)境能激發(fā)一些反思。
和一位受過媒體培訓(xùn)的技術(shù)主管談話時,事情從來沒有那么戲劇化過。但這并不僅僅是我的一廂情愿。哈夫曼,一個14年的谷歌老手,目光和善,留著濃密山羊胡子,他認(rèn)真思考了我對未來數(shù)字助理時代提出的隱私問題。他說,首先,這可能需要立法。他也是在討論谷歌助手的發(fā)展方向,這對谷歌思考其最重要產(chǎn)品有啟發(fā)意義。
哈夫曼建議,在接下來的五年里,Assistant可以實現(xiàn)與人自然對話的基礎(chǔ),但從計算機(jī)科學(xué)的角度看,自然對話根本就不是基礎(chǔ)。他說"Hey" 或者“OK”這樣的喚醒語是“真的很奇怪”。哈夫曼想讓Assistant了解你的心情和語氣,覺察你是否感到沮喪。他想讓軟件完全記住你昨天與其進(jìn)行的一次討論,這樣今天你就可以接著昨天的話繼續(xù)說。
我問他10年后的愿景。他沉思著說,也許物理機(jī)器人,不僅僅是可以交談的機(jī)器人,還是可移動和做事的機(jī)器人,并將成為家用產(chǎn)品,數(shù)字助理也可與之連接。
我們的摩天輪之旅結(jié)束了,座艙慢慢下降到地面。我們路過了一輛停在軌道上的拉斯維加斯單軌車,也有“Hey Google”的字樣印在側(cè)面。單軌車正準(zhǔn)備駛離車站,就變成了“Hey Go”。
Duplex的高光時刻
2016年5月,皮查伊(Pichai)在Google年度I/O會議上向7000名開發(fā)人員介紹Assistant的前幾天,我在他的辦公室里坐著一起聆聽產(chǎn)品推介。這家搜索巨頭正在籌備Google Home,一個智能家庭語音助手,將與Amazon Echo正面交鋒。很明顯,Assistant會和Alexa歸為一類。但從一開始,皮查伊就堅決表態(tài)Assistant還有其他功能。“這是谷歌在問用戶,‘嗨,我能幫什么忙嗎?’可以把它看作是建立你個人的谷歌?!?/p>
一番刺激后,惹惱的皮查伊最終將點(diǎn)燃市場的功勞歸功于亞馬遜。他說,“有些地方我們會領(lǐng)跑,有些地方會有人指路,然后我們來實現(xiàn)?!?/p>
過去的一年里,這種野心變得愈發(fā)明顯。今年5月,皮查伊發(fā)布了Duplex,一款模仿人類語言、聲音逼真、令人驚訝的人工智能。軟件使用諸如“uh、“um”之類的語氣詞,說話時會有停頓,好像在思考接下來要說什么,即使它的反應(yīng)其實是預(yù)先設(shè)定好的。目前,Duplex正在進(jìn)行有限的公開測試階段。
Duplex旨在讓谷歌助手為你預(yù)訂餐廳和預(yù)約理發(fā)。但幾乎立刻,行業(yè)觀察者、人工智能倫理學(xué)家和消費(fèi)者開始擔(dān)心軟件是否也能欺騙與之交談的人。后來谷歌表示,將加強(qiáng)信息披露,讓人們明確他們是在和機(jī)器人說話。
哈夫曼表示,這是谷歌的關(guān)鍵時刻。他說,“強(qiáng)烈的反響出乎我的意料。這向我們表明了社會問題的重要性?!?/p>
立法之陰霾
其中一個大問題是:在數(shù)字助理越來越智能的時代,隱私如何保護(hù)?
這一點(diǎn)很重要,硅谷正面臨比以往任何時候更多的隱私審查。過去兩年,F(xiàn)acebook一直在抵御一場又一場的危機(jī),從虛假宣傳到大規(guī)模數(shù)據(jù)泄露。去年12月,皮查伊被拉到國會面前,應(yīng)答有關(guān)中國項目Dragonfly的問題,并回應(yīng)谷歌對用戶個人信息的全面收集。
假如還要在起居室里放一個設(shè)備,有一個麥克風(fēng),一直在聽喚醒語“Hey Google”,事情也會變得更加復(fù)雜。
擁有計算機(jī)科學(xué)博士學(xué)位的哈夫曼說,“想想Google Home或者Alexa,這是有史以來第一款非個人的設(shè)備。它們是真正生活在共享環(huán)境中的計算設(shè)備……這些東西現(xiàn)在和我們一起住在這個房間里,我們都是用戶。那么隱私是如何保障的呢?”
哈夫曼指出谷歌圍繞人工智能在制定議程方面已經(jīng)完成的工作。去年6月,皮查伊發(fā)布了一套人工智能道德準(zhǔn)則,指導(dǎo)公司如何使用這項技術(shù)。此前,谷歌員工抗議公司與五角大樓簽訂幫助開發(fā)人工智能分析無人機(jī)足跡的合同。這些指導(dǎo)方針包括發(fā)誓永遠(yuǎn)不為武器開發(fā)人工智能,只創(chuàng)造“造福社會”的技術(shù)。
但公司的自我監(jiān)管可能不會是唯一的辦法。
哈夫曼表示,“老實說,我認(rèn)為隨著社會弄清楚這些技術(shù)是如何適應(yīng)時代的,大概最終也會采取新的立法。你看電話之類的東西;這已經(jīng)存在很久了。關(guān)于如何使用電話,打電話來干什么,有很多法律。比如你不能在沒有授權(quán)的情況下竊聽電話。”
哈夫曼還表示,“所以那一規(guī)則適用于那一代的技術(shù),而有了人工智能,我們的社會將思考一些新的規(guī)則?!?/p>
當(dāng)被問及這項立法可能會是什么樣子,哈夫曼收回了他的聲明。他說,“我不知道是否需要立法。我不是談?wù)撨@件事的合適人選?!彼硎荆珶o論如何,這將由社會來決定。
哈夫曼不會推測監(jiān)管的類型,但斯坦?;ヂ?lián)網(wǎng)與社會中心隱私主管珍·金(Jen King)對立法倒有一番見解。她如今正在研究通過智能語音助手收集的數(shù)據(jù)類型。
金說,監(jiān)管可能看起來類似于由通用數(shù)據(jù)保護(hù)條例(GDPR)引入的限制,這是一項在2018年5月生效的全面歐洲法律。它使消費(fèi)者能更好地控制他們移交給科技公司的個人信息。對于數(shù)字助理,立法可能意味著如果消費(fèi)者希望刪除數(shù)據(jù),政府可以強(qiáng)制執(zhí)行刪除政策,或者法律可能要求對數(shù)據(jù)的具體使用方式尋求更具體的同意權(quán)限,并確保數(shù)據(jù)不會被“永久”使用。
金認(rèn)為,我們都應(yīng)該關(guān)注谷歌及其他公司未來在設(shè)備上的默認(rèn)設(shè)置,以免人們無意中放棄對個人信息的保護(hù)。
金說,“對大多數(shù)人來講,谷歌是互聯(lián)網(wǎng)的門戶。這些助手進(jìn)一步扮演了這一角色。公司塑造了用戶體驗,但會以有商業(yè)利益的方式來做。”
競爭態(tài)勢正在加劇
哈夫曼和他的團(tuán)隊為谷歌助手開發(fā)功能時,皮查伊也在做相應(yīng)的工作。哈夫曼表示,首席執(zhí)行官經(jīng)常報告軟件的缺陷和低效。例如,當(dāng)他說"Hey Google" 時,如果錯誤的裝置啟動了,他會告知哈夫曼。皮查伊試圖設(shè)置軟件,讓助手也可以聽從家人的指令時,他告訴哈夫曼這個過程太復(fù)雜了。
哈夫曼笑著說,“我有時也會被人大聲嚷嚷,這是對的。皮查伊真的有在推動我們前進(jìn)?!?/p>
急于證明消費(fèi)者有實際使用語音助手,上個月亞馬遜和谷歌都做了一些他們幾乎不可能做的事情:他們公布了用戶數(shù)據(jù)。
亞馬遜聲稱Alexa設(shè)備銷量超過1億臺,谷歌不甘示弱,幾日后宣布Assistant銷量即將突破10億。然而兩家的數(shù)據(jù)都無法說明真相。例如,由于Assistant軟件是預(yù)安裝的,所以這十億個輔助設(shè)備中的絕大多數(shù)(谷歌不會公布具體數(shù)據(jù))是自動安裝到安卓手機(jī)上。當(dāng)然,谷歌也會在自己的Pixel手機(jī)上安裝Assistant。
我問哈夫曼,這個數(shù)字何時會被非手機(jī)設(shè)備所主導(dǎo)。他說他也不知道,但谷歌正在尋找Assistant的兩大用武之地——汽車和房子,最終可能會合并。
谷歌關(guān)于智能家居的作戰(zhàn)計劃記錄良好。谷歌希望在智能家庭助手市場上能與亞馬遜及其Echo設(shè)備一較高下。谷歌還想讓Assistant盡可能多地與三星、索尼和海信等制造商的智能電視合作。但鮮有提及谷歌推進(jìn)Assistant為汽車提供服務(wù)。在國際消費(fèi)電子產(chǎn)品展上,谷歌公布了一些汽車輔助設(shè)備,包括Anker Roav的汽車電話適配器,可插入打火機(jī)使用。
這個想法將谷歌助手的適用范圍延伸到越來越廣泛的領(lǐng)域。這并不容易。在計算成功率時,哈夫曼回到了拉斯維加斯的主題。
他說,“對于大多數(shù)人而言,虛擬助理,不論是我們的還是其他人的,都還不太適合普及大眾,還沒達(dá)到‘沒有這個我就活不下去’的境界?!彼怨雀枞匀挥性S多努力要做?!昂翢o疑問,這是一個賭注。”