問之科技由翟魯峰創(chuàng)立于2015年9月,主要為機器人與智能家居領域廠商開發(fā)語音交互技術、平臺以及硬件產品。今年6月7日,其智能音箱產品“麥寶”正式發(fā)布。
問之科技創(chuàng)始人翟魯峰
到目前,問之科技共有十余個重點合作商家,如機智云、棠棣機器人、南江機器人等。團隊近期在優(yōu)化“麥寶”,接下來將推出“高顏值”的一款;另外還會推出智能語音物聯(lián)網(wǎng)方案。
注:翟魯峰向剛承諾文中數(shù)據(jù)無誤,為其真實性負責,鉛筆道已備份錄音速記,為內容客觀性背書。
“語音交互的春天”
2014年年初,“需求來了,創(chuàng)業(yè)的春天也就來了。”這是翟魯峰在做天貓魔盒時,發(fā)現(xiàn)其對非接觸式交互(尤其是語音交互)需求強烈后的感嘆。
天貓魔盒,高清4K網(wǎng)絡電視機頂盒,用戶長按遙控器的語音鍵即可語音搜索,直接查詢影視歌曲。其中的云OS系統(tǒng)中的語音交互隨后也被應用在康佳等數(shù)個品牌的智能電視上。
翟魯峰回憶起在PC時代,用戶多用鍵盤與鼠標來與電腦交互。盡管微軟的office軟件也支持語音輸入,但使用者甚少。從業(yè)界整體來看,也很少有相應的硬件產品。
隨后的手機時代,用戶對語音交互的需求增加,比如Siri的誕生以及廣泛應用。
不過此時,語音交互更多是作為其他功能的輔助手段而存在。因為即便沒有語音交互,用戶也可以很方便地使用手機。但對于去屏化智能硬件來說,觸屏輸入基本沒可能,語音交互成為主要的交互手段。
繼天貓魔盒后,翟魯峰在阿里智能生活事業(yè)部分別接觸了智能家居與機器人,這樣的感受漸深。
“語音交互將成為去屏化硬件的主要交互手段,并且有可能成為家庭智能交互的入口”;與此同時,盡管亞馬遜推出智能音箱echo,但國內此類產品尚且不多,而且國內對于音箱的接受度普遍不高,創(chuàng)業(yè)機會蘊藏其中。
然而,受限于在大公司難以推進創(chuàng)新業(yè)務的通病,2015年5月,他決定離開阿里創(chuàng)業(yè)。9月,問之科技成立。
重點是“云”
考慮到國內用戶對音箱的低接受度,翟魯峰想到,一來要盡可能增加智能家居控制等家庭服務功能;二來,要將產品的體積做的盡可能小;再來,要降低定價。
2016年4月,亞馬遜推出Echo Dot,其搭載了與前一代產品相同的遠場語音識別技術以及語音控制功能。不過由于體積甚小(只有3厘米高),它無法單獨發(fā)揮前一代產品支持的揚聲器功能。另外,Echo Dot價格大幅降低,約50美元。
它所走的路線與翟魯峰對問之科技產品的設定不謀而合。不過據(jù)他解釋,他的產品定位是在2015年年底就定下的。另外,與國外不同,國內智能家居市場長時間不溫不火,老家電則是占據(jù)市場的主要力量。
基于此,翟魯峰一開始就將紅外模式設定在產品設計之中。市場化方面,他決定將產品分為模組與硬件成品,前者面向要做音箱類產品的客戶,后者可直接出售。
不過,硬件產品的推出更多是為了云端服務器,“云服務器未來會是包括語音數(shù)據(jù)、口音、講話方式、行為習慣、情緒變化等用戶數(shù)據(jù)的沉淀之處”。模組的出售也是為了積累云端資源。
起初,翟魯峰預估半年內就能將產品做出來,然而事實證明他過于樂觀。
因為在產品開發(fā)中,語音識別中遠講、喚醒等模塊的打磨都花了遠超過翟魯峰預期的時間與精力。為了實現(xiàn)語音遠講識別,就要盡量避開周圍環(huán)境的干擾,為此,團隊反復調試算法與結構,并開發(fā)出特定的遠講降噪模組;而為了讓人機語音交互更流暢,團隊加入Oneshot喚醒+識別。
另外,算法的語音識別等主要部分被放在云端,產品端的則有喚醒識別與機器檢測。其中,喚醒識別與響應主要是通過加強版靜音檢測模塊的使用來實現(xiàn)的。此外,針對特定的家庭智能硬件,團隊還做了基于語音神經網(wǎng)絡(DNN)芯片加速的離線語音識別,用于實現(xiàn)本地端喚醒、云端識別。
◆語音交互模組
年中,語音交互模組發(fā)布,陸續(xù)有商家前來試用。銀行也是客戶之一。之前,交通銀行智能客服機器人“嬌嬌”的推出吸引了一大波眼球。
翟魯峰提到,銀行的智能服務機器人一方面確實可以代替銀行人員的部分服務,另一方面也是吸引關注的舉措之一。而且比起家庭對玩具機器人的低付費意愿,銀行的買單率相對要高。所以當時他們對這部分業(yè)務也投入了比較大的精力。不過服務機器人語音語義解決方案的正式發(fā)布與落地銀行則是在今年3月。
年終,語音神經網(wǎng)絡芯片與問之云平臺1.0——語音云和語義云發(fā)布,已可為商家提供服務。
小而輕的“麥寶”
云服務器固然重要,但找到能讓用戶接受的呈現(xiàn)形態(tài)也很重要。為此,問之科技推出小而輕、WiFi即接即用的智能音箱“麥寶”。
◆小巧的“麥寶”
“麥寶”是一個90mm*90mm*30mm的長方體,重量約163克。其可兼容近10萬個型號的老家電產品,實現(xiàn)遠講識別、虛擬助理與音箱等功能,并支持在語音交互平臺的喚醒詞與語義定制。
針對不同的使用場景,為實現(xiàn)更高的適配與識別精準度,團隊開發(fā)語音語義定制的方法也有所不同。
“麥寶”搭載有問之科技自行開發(fā)的語音交互平臺,可與用戶展開多輪對話(理論上沒有輪次上限)。在多輪對話中,系統(tǒng)會主動引導用戶給出關鍵信息,確保任務被準確執(zhí)行。
在做“麥寶”時,因為想要做成小巧外觀,產品內部的播放口與麥克風必然會離得很近,而這樣很難實現(xiàn)在音樂播放時的喚醒打斷,團隊不得不反復調整結構與算法,最終,團隊用多模塊協(xié)作解決了這個問題。
而由于國內工廠在智能音箱方面并沒有成熟的方案體系,所以電路與驅動等關鍵部件由團隊自行設計,其他工業(yè)設計則交由代工廠完成。
“麥寶”是一款C端產品。之所以選擇面向C端,是源于翟魯峰在做天貓魔盒過程中對客戶資源的積累,以及對相應市場生態(tài)的了解。此外,團隊成員對C端產品更有偏好,也更樂于做直接面向消費者的產品。
“B端產品的市場是有限的,做完一批客戶后,基本就是維護,很少能快速爆發(fā);C端產品則不同,當一代人接受了一款新品之后,需求量是非常大的”,基于自己此前開發(fā)C端產品的經驗,翟魯峰如是說。
今年3月,問之云平臺1.1——語音物聯(lián)云發(fā)布。6月7日,在CES Asia 2017現(xiàn)場,“麥寶”正式發(fā)布。
上半年,團隊的主要精力都放在音箱產品的設計與生產上,接下來的業(yè)務重點將放在智能家居上。到目前,問之科技共有十余個重點合作商家,如機智云。
團隊近期在優(yōu)化“麥寶”,接下來將推出”高顏值”的一款;另外還會推出智能語音物聯(lián)網(wǎng)方案。