軟銀投資了一家叫 ObEN 的人工智能公司,其實是它旗下 SB Next Media 創(chuàng)新基金投出的第一筆錢。這個基金成立于 2016 年 12 月,主要投資可應(yīng)用于商業(yè)的內(nèi)容、媒體平臺或技術(shù),包括虛擬現(xiàn)實和增強現(xiàn)實。
軟銀的基金處女投就給了這么一家 “年紀(jì)輕輕” 的公司,真的很是好奇原因啊!
對此,軟銀韓國合伙人及創(chuàng)新基金董事總經(jīng)理 J.PLee 解釋了一下:
我們在尋找 VR/AR 公司時,看到了 ObEN,讓我們興奮的是,他們的應(yīng)用引入了人工智能。同時,他們一流的演講,一流的計算機視覺和自然語言處理技術(shù),以及優(yōu)秀的團隊都在致力于為消費者創(chuàng)造個人 AI。
對于這家公司的融資情況:
2014 年 7 月,獲得第一筆種子輪融資;
2016 年 7 月,加入 HTC Vive X 孵化計劃;
2016 年 11 月,獲得 770 萬美元 A 輪融資;
2017 年 3 月,獲軟銀韓國的投資。
可以看出,ObEN 的發(fā)展比較穩(wěn)健。
那么,這家公司到底做了什么,能讓軟銀出手呢?
簡單來說,ObEN 可以讓你用一張自拍照幾秒鐘構(gòu)建你的 3D 頭像。
只要用手機拍下正面一張自拍照片,就能兩秒鐘內(nèi)生成一個完整的 3D VR 頭像化身(照片角度越多,重建效果越精確)。
這個 3D 頭像化身還擁有完整表情支撐,讓你的 3D VR 頭像擁有七情六欲,喜怒哀樂。
比如,委屈的時候是這樣的
憤怒的時候是這樣
你開心啦,眉毛抖呀抖,是不是很丑
除了能快速的生成你個人的 3D VR 頭像,為了更像你,索性連你的語音也一起生成。
只要錄下兩分鐘的聲音,就可以借由語音模擬器,用同樣的聲音說話、唱歌,甚至可以講出流利的不同國家語言!
據(jù)說兩位創(chuàng)始人 NikhilJain 和 Adam Zheng 是因為想讓自己的聲音時常陪伴孩子,才創(chuàng)立了這家公司。
ObEN 使用的并不是簡單的語音合成技術(shù),它的技術(shù)可以捕獲完整的聲波紋。它不是記錄單個音節(jié),也不只是語調(diào),然后顆粒輸出。而是應(yīng)用深度學(xué)習(xí)語音合成,創(chuàng)建任何語言的數(shù)字聲紋。
比如,你是個美國人,使用 ObEN 技術(shù)錄下語音,獲取你的聲音后,可以用你的聲音來說中文,就好像你會說中文一樣。錄制聲音也不需要特殊的錄音棚,只要一個沒有太多背景噪音的地方。
結(jié)合以上兩點,ObEN 可以構(gòu)建一個樣子像你、聲音像你,還有豐富表情的 3D VR 頭像。同時,他還可以比你更厲害,唱你不會唱的歌,說你不會說的語言。
ObEN 的優(yōu)勢是將人臉 3D 重建和語音合成相結(jié)合,使得合成的虛擬形象更加貼近人類,這樣的話,我們是不是很快就能在虛擬世界里 “活過來” 呢?
今年 CES 期間,ObEN 接到了一個商業(yè)項目,給凱撒娛樂集團旗下的 LINQ 酒店打造了一個微信機器人(用來迎賓)。
這個機器人叫 Ben,它可以在極短的時間內(nèi)識別語言、語音并做出反應(yīng)與使用者進行交流。
除了點擊機器人 Ben 身上的觸摸屏幕面對面交流來獲取周邊信息,比如餐飲,娛樂表演,夜生活等等??腿艘部梢灾苯酉騽P撒娛樂集團微信公號直接發(fā)送指令,和虛擬的 “Ben” 交流。
“你們這群愚蠢的人類,見了朕,還不下跪….”
應(yīng)用 ObEN 的語音識別技術(shù)以后,微信機器人可以將與之溝通者的聲音儲存一段時間,還可以把該聲音應(yīng)用到任何語言、任何內(nèi)容的表達之中。
最后,看 ObEN 的集體照,團隊成員只有 20 幾人,但背景卻多元化。他們覆蓋了人工智能、機器深度學(xué)習(xí)(deep-learning)、語音識別/合成,以及電腦視覺 & 圖像預(yù)測等高度復(fù)雜的新領(lǐng)域,而且擁有多項專利和知名的專家顧問團。hin有潛力啊!