解讀音視頻技術的發(fā)展趨勢
2016年,即構(gòu)推出了全球首創(chuàng)的直播連麥技術,用自研的技術,在不改造基點網(wǎng)絡、不改造任何場景的情況下,后臺服務器和前端引擎做到1到1.5秒的低延遲,在極低延遲下支持更多主播連麥。技術推出后,吸引了國內(nèi)過半大型的直播平臺,引入連麥的方式來豐富直播場景,“直播”和“連麥”也自然而然成了即構(gòu)的標簽。
“QQ”是因為即構(gòu)團隊很多人來自QQ團隊,在騰訊待了超過10年的人很多,包括我自己。我們當時在騰訊主要做兩個事情,一是花了五年來重構(gòu)整個QQ的客戶端,二是花了五年做了QQ的音視頻引擎,在這兩個五年中,我們獲得了億萬級用戶通訊產(chǎn)品技術經(jīng)驗。
2015年,從騰訊出來后,我們成立了即構(gòu)。一開始我們就選擇了一條最難的路:基于公有云開放的架構(gòu),重新自研音視頻引擎和后臺服務,開放技術去幫助企業(yè)做業(yè)務產(chǎn)品的開發(fā),而不是為了省事而采用開源的代碼。這樣做成功率很低,花費的人力成本也很高。之所以這么硬氣,是因為我們CTO金建忠和技術骨干,很多從大學開始就做音視頻相關的技術,到現(xiàn)在有超過18年的技術積累。
因為我們自研的音視頻引擎,用了比較好的架構(gòu)設計,在軟件層做到了同時支持多方通訊,2017年3月,即構(gòu)推出了32路視頻通話技術,在當時是業(yè)內(nèi)首家,并且有了落地的應用,比今年6月蘋果發(fā)布的FaceTime支持32路早了整整一年。
從創(chuàng)立以來,即構(gòu)就專注做技術,事實證明,大家是愿意為好的技術買單的。在成立后三年多的時間里,即構(gòu)得到了騰訊、花椒、映客、咪咕、好未來、喜馬拉雅等500+家各行各業(yè)客戶的信任,包括老東家騰訊。隨著接觸到的客戶越來越多,在行業(yè)里發(fā)展的越來越深,我們發(fā)現(xiàn),音視頻技術的應用場景遠比想象中的多,應用規(guī)模也越來越大。
直播是音視頻技術沉淀多年后得到的初步應用,也讓大家意識到:音視頻技術不僅局限用于會議系統(tǒng)這樣的商業(yè)領域,也不僅僅是社交群聊,還能用在直播。而在直播中又延伸出如秀場直播、多主播連麥、直播相親、直播答題、K歌合唱等泛娛樂直播場景。
泛娛樂直播無法忽視的是游戲直播,設備和網(wǎng)絡的發(fā)展讓游戲能支持更大的碼率傳輸,音視頻的介入,狼人殺、棋牌游戲等桌游線上化時更真實,玩MOWAA游戲、吃雞、王者榮耀時語音溝通也讓游戲更社交化,未來,音視頻功能將會是游戲直播的標配,同時,越來越多游戲往社交化發(fā)展。
其中還延伸出彩票直播這種新奇的玩法,用戶直接在線上購買彩票,即買即刮,直播兌獎,不再像以前一樣需要到彩票點購買。除了泛娛樂直播,音視頻技術還能用在在線教育、金融、公檢法、民生各種領域,還能跟各種硬件結(jié)合,實現(xiàn)不同的玩法。
在線教育不算是新場景,今年因為技術發(fā)展和環(huán)境的改善,還有教育機構(gòu)的投入和運營,有很多種應用場景,如1對1、1對多的小班課堂,跨國小班、雙師課堂、音樂陪練等。有個明顯的改變就是體制內(nèi)K12的中小學開始擁抱新技術,很多已經(jīng)開始采用雙師課堂的形式,實現(xiàn)了優(yōu)質(zhì)老師的共享。在學校推動和政府支持下,硬件發(fā)展也很快,像錄播機、觸控屏、黑板也改造成適應雙師課堂的場景。
在線金融方面,視頻開戶、視頻客服、視頻投資顧問、視頻雙錄很多證券公司和銀行已經(jīng)有在用了;企業(yè)級的又有企業(yè)直播、視頻會議、呼叫中心、賽事直播等等,今年的世界杯和亞運會直播,咪咕直播就使用了即構(gòu)的云導播臺,不用專業(yè)的直播機器,就能快速地實現(xiàn)導播直播,融入更多互聯(lián)網(wǎng)自由的元素。
公檢法也可以接入音視頻技術,實現(xiàn)可視化執(zhí)法、遠程接訪、視頻庭審。民生政務方面,可以通過小程序接入技術,實現(xiàn)視頻辦事。即構(gòu)6月給海淀工商分局做的平臺,就讓用戶在小程序上通過視頻通話就能咨詢和辦理業(yè)務,以往來幾趟才弄好的事情現(xiàn)在幾分鐘就能搞定。
除了單一線上的支持,音視頻技術也可以跟軟硬件結(jié)合,形成一站式解決方案。拿線上抓娃娃機為例,線上涉及到APP/H5,線下涉及到一系列的娃娃機硬件,娃娃機要對接到互聯(lián)網(wǎng)有很大障礙。去年娃娃機風口時,很多客戶折騰了幾個月,都沒做起來。為了方便客戶,即構(gòu)直接在線下還建立了娃娃機房,將技術、軟件、硬件全鏈條串起來,形成了一站式抓娃娃軟硬件解決方案,客戶只管專心做線上用戶運營,其他全部由即構(gòu)搞定。
我們也能看到,越來越多的智能硬件產(chǎn)品開始接入音視頻技術,像無人機、車聯(lián)網(wǎng)、機器人、智能眼鏡等,兩者結(jié)合后又能應用到不同的行業(yè)。以智能眼鏡為例,能應用在鐵路、電力、水利的巡檢,巡檢過程中和在辦公室的專家遠程互動,指導操作;同樣的場景可以用在汽修廠、公安執(zhí)法、銀行導購當中。
然而,在接觸客戶的過程中,我們發(fā)現(xiàn)很多客戶排斥接入一個新技術,覺得技術和新場景結(jié)合起來非常痛苦,需要開發(fā)團隊需要對原有業(yè)務進行改造,而這個改造的動作,造成了產(chǎn)品業(yè)務體驗的差異,后續(xù)開發(fā)新的產(chǎn)品就有可能返工重造,擴展很不平滑,用戶感受也不愉快,這種其實就是有形的技術。
我們要做的是將技術無縫融合到業(yè)務場景中,通過業(yè)務與技術結(jié)合,推動產(chǎn)品的持續(xù)發(fā)展,來增強用戶的體驗,而不是讓其變得更差,用戶在體驗的時候是感受不到技術的,能感受到的是產(chǎn)品越來越好,用起來很愉快。
要真正把一個技術無形融合到產(chǎn)品當中,必須要下苦功。即構(gòu)在三方面做了努力,一是堅持以技術驅(qū)動,自研音視頻引擎,將80%的精力放在技術研發(fā)上。二是將技術從點做到面,從提供標準化的SDK,到提供全棧式的解決方案。三是以用戶體驗為導向,配置1對1咨詢顧問,通過和客戶深入交流產(chǎn)品應用的細節(jié),及時收集解決問題,來不斷打磨技術服務。
目前,即構(gòu)已經(jīng)服務了500+企業(yè)用戶,覆蓋了100+國家和地區(qū),鏈接全球5億+的終端用戶。技術無形融入各行各業(yè)后,線上方式還原線下溝通場景,將幫助企業(yè)實現(xiàn)之前無法實現(xiàn)的場景,提高用戶體驗,讓產(chǎn)品有更大的創(chuàng)新空間,也推動了整個社會高效地工作,加速全球資源共享和技術共享。