數(shù)據(jù)如何助力人工智能的到來
掃描二維碼
隨時(shí)隨地手機(jī)看文章
國(guó)家層面來看,2015年至2019年,人工智能行業(yè)政策也在不斷迭代更新。從最初的“智能制造”到“加速AI技術(shù)研發(fā)和轉(zhuǎn)化”再到“深化大數(shù)據(jù)、人工智能等研發(fā)應(yīng)用”,標(biāo)示著國(guó)內(nèi)人工智能正在進(jìn)入全新的發(fā)展階段,AI應(yīng)用時(shí)代的大幕已然開啟。
未來人工智能勢(shì)不可擋是共同認(rèn)知?;ㄊ届拧凹肌眳s無法支持當(dāng)前實(shí)際應(yīng)用落地的人工智能企業(yè)將寸步難行也是共識(shí)。
人工智能的關(guān)鍵要素包括算法、算力、數(shù)據(jù)。如華為、阿里等都在積極布局智能計(jì)算,芯片代表算力,智能框架代表算法,并相繼投入到智慧城市、自動(dòng)駕駛、新零售等眾多領(lǐng)域。超強(qiáng)算力,高效算法成為巨頭們必備的實(shí)力tag,再加上目前人工智能企業(yè)多半還在靠算法盈利,其重要性可想而知。
相比之下,數(shù)據(jù)作為人工智能的基礎(chǔ)原料,在這個(gè)組合里雖然很必要卻低調(diào)很多。
海量數(shù)據(jù)到AI數(shù)據(jù)的“距離”
人工智能多樣化應(yīng)用正在帶動(dòng)數(shù)據(jù)采集標(biāo)注產(chǎn)業(yè)的發(fā)展,從前的眾包數(shù)據(jù)服務(wù)模式和通用數(shù)據(jù)集無法滿足AI企業(yè)的場(chǎng)景化需求,我們需要重新審視從海量數(shù)據(jù)到我們真正想要的AI數(shù)據(jù)究竟隔了多遠(yuǎn)。
AI企業(yè)追求速度與激情。比如,一般AI產(chǎn)品在發(fā)布前一個(gè)月就需要獲取標(biāo)注好的精準(zhǔn)數(shù)據(jù)進(jìn)行訓(xùn)練,數(shù)據(jù)標(biāo)注前還需要先完成數(shù)據(jù)的采集。這對(duì)AI數(shù)據(jù)的質(zhì)量和時(shí)效性要求很高。
舉個(gè)栗子,假如你要填湖蓋房子有三種方式。第一種自己召集人馬買裝備找石子,第二種雇多人每天往湖里扔石子,第三種是直接找賣石子的用他家的挖掘機(jī)快速填平。
Testin云測(cè)CTO陳冠誠(chéng)對(duì)AI數(shù)據(jù)的描述很形象直觀,AI應(yīng)用落地本身是基于眾多場(chǎng)景的。如果把AI應(yīng)用看作一個(gè)個(gè)學(xué)生,他們可能有不同的性格、脾氣、擅長(zhǎng)領(lǐng)域,如果老師(算法工程師)想教好這些學(xué)生,需要多樣化的優(yōu)質(zhì)數(shù)據(jù)“教材”來適應(yīng)各種專長(zhǎng)、領(lǐng)域教學(xué)的需求,把他們打造成更好的 AI 應(yīng)用。
從自動(dòng)駕駛到聊天機(jī)器人再到醫(yī)學(xué)診斷和成像,AI應(yīng)用的成功落地與企業(yè)效率、用戶體驗(yàn)和產(chǎn)品質(zhì)量息息相關(guān),其背后能夠起到有效支撐作用的優(yōu)質(zhì)AI數(shù)據(jù)才代表了真正的數(shù)據(jù)價(jià)值。隨著人工智能產(chǎn)業(yè)落地的發(fā)展加速,AI應(yīng)用對(duì)優(yōu)質(zhì)數(shù)據(jù)的需求越來越強(qiáng)烈。定制化和場(chǎng)景化的優(yōu)質(zhì)數(shù)據(jù)正在為人工智能應(yīng)用落地帶來更多的可能性。
基于場(chǎng)景化應(yīng)用高效提供優(yōu)質(zhì)數(shù)據(jù),保證數(shù)據(jù)安全,在我看來,這是TesTIn云測(cè)旗下的云測(cè)數(shù)據(jù)作為唯一一家數(shù)據(jù)標(biāo)注服務(wù)商與第四范式等多家AI企業(yè)同時(shí)登上ToB行業(yè)影響力·產(chǎn)品價(jià)值榜的原因,這也表明了AI數(shù)據(jù)的重要性日漸突出。
AI數(shù)據(jù)服務(wù)領(lǐng)域的頭部玩家云測(cè)數(shù)據(jù)通過在華北、華東、華南自建數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地,為智能駕駛、智能家居、智慧城市、智慧金融、新零售等領(lǐng)域提供定制化的數(shù)據(jù)標(biāo)注、數(shù)據(jù)采集服務(wù),支持文本、語(yǔ)音、圖像、視頻等各類型數(shù)據(jù)的處理。其目前擁有行業(yè)內(nèi)最大規(guī)模的專業(yè)數(shù)據(jù)服務(wù)全職人員,用來構(gòu)建整體 AI 數(shù)據(jù)的生態(tài)。
除了這些硬實(shí)力之外,云測(cè)數(shù)據(jù)還有自研數(shù)據(jù)標(biāo)注系統(tǒng)、數(shù)據(jù)采集系統(tǒng),并構(gòu)建了完善的數(shù)據(jù)生產(chǎn)流程等,通過專業(yè)的項(xiàng)目經(jīng)理來把控每一個(gè)AI數(shù)據(jù)的精準(zhǔn),以保證數(shù)據(jù)質(zhì)量的先進(jìn)性。
在數(shù)據(jù)安全方面,云測(cè)數(shù)據(jù)始終主張:
第一,不濫用數(shù)據(jù),數(shù)據(jù)交付后清毀數(shù)據(jù)不留底,絕不二次使用;第二,不侵犯隱私,與所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權(quán)協(xié)議,確保AI企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī);第三,建立了相關(guān)的數(shù)據(jù)保障機(jī)制,如從防火墻的設(shè)置、內(nèi)部信息系統(tǒng)的管護(hù)乃至標(biāo)準(zhǔn)化的流程作業(yè)體系等。
現(xiàn)在的人工智能,一定不是我們理想中的樣子,我們想要的是BB-8、賈維斯還有莫斯,然而行業(yè)中我們接觸更多的是引導(dǎo)型機(jī)器人、X臉識(shí)別、語(yǔ)音助手等等,這是我們與未來的距離。
在這段路程中,會(huì)有更多的AI企業(yè)為了提升自身的競(jìng)爭(zhēng)力,追求最新技術(shù),優(yōu)先創(chuàng)新落地應(yīng)用,而AI數(shù)據(jù)服務(wù)專業(yè)領(lǐng)域的挑戰(zhàn)也會(huì)隨之增多,我們期待云測(cè)數(shù)據(jù)能夠提供出更多的高質(zhì)量數(shù)據(jù)教材,推動(dòng)人工智能應(yīng)用時(shí)代加速到來。