澳鵬張童皓:專業(yè)化數(shù)據(jù)服務(wù)平臺是AI工業(yè)化的突破口
(全球TMT2021年7月13日訊)一份最新的全球《2021人工智能與機器學(xué)習(xí)現(xiàn)狀》調(diào)研報告顯示:2021年,53%的AI團隊報告預(yù)算在50萬美元到500萬美元之間(而2020年約為三分之一),這個強烈的信號表明AI對于各行各業(yè)各種規(guī)模企業(yè)的成功變得越來越重要。這份由AI數(shù)據(jù)服務(wù)平臺公司澳鵬(Appen)連續(xù)第7年發(fā)布的AI現(xiàn)狀年度報告還強調(diào),在2020年由于新冠疫情,各規(guī)模的企業(yè)都加速推進了AI戰(zhàn)略,并且在2021年還將繼續(xù)保持這種勢頭。
在中國,AI技術(shù)應(yīng)用開始全面覆蓋日常生活、科學(xué)研究、社會治理、商業(yè)創(chuàng)新和國家安全等經(jīng)濟社會的關(guān)鍵領(lǐng)域,以空前的廣度和深度推動社會發(fā)展。由中國信通院與中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟推出的《2021人工智能核心產(chǎn)業(yè)白皮書》指出,工程技術(shù)正在引領(lǐng)AI產(chǎn)業(yè) -- 技術(shù)成本快速下降,同等算法水平所需計算量每8個月降低一倍、成本降低百倍,涌現(xiàn)了多樣化的研發(fā)和技術(shù)服務(wù)平臺,這些說明AI正從技術(shù)理論突破過渡到工程化落地應(yīng)用的階段。
深度神經(jīng)網(wǎng)絡(luò)是當(dāng)前AI的主要模型,而監(jiān)督學(xué)習(xí)則是構(gòu)建(訓(xùn)練)深度神經(jīng)網(wǎng)絡(luò)的主要方法,監(jiān)督學(xué)習(xí)所需要的大規(guī)模、高質(zhì)量的人工標(biāo)注數(shù)據(jù)集是AI產(chǎn)業(yè)發(fā)展的剛需,也是AI工業(yè)化的主要瓶頸之一。在中國,正在大量涌現(xiàn)AI數(shù)據(jù)標(biāo)注產(chǎn)業(yè)基地,但當(dāng)前的AI數(shù)據(jù)標(biāo)注產(chǎn)業(yè)仍處于初級階段。澳鵬公司產(chǎn)品研發(fā)總監(jiān)張童皓表示,用戶對于數(shù)據(jù)規(guī)模、質(zhì)量和多樣性等要求越來越高,專業(yè)化數(shù)據(jù)服務(wù)平臺是AI工業(yè)化的突破口。
澳鵬《2021人工智能與機器學(xué)習(xí)現(xiàn)狀》調(diào)研報告指出,獲取足夠的優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)來部署AI是各種規(guī)模企業(yè)成功的重大障礙,而全球絕大多數(shù)企業(yè)都在某種程度上采用了專業(yè)數(shù)據(jù)供應(yīng)商 -- 這反映了數(shù)據(jù)采集、準(zhǔn)備和管理是AI面臨的首要挑戰(zhàn)。

根據(jù)澳鵬的調(diào)研,使用專業(yè)數(shù)據(jù)供應(yīng)商的企業(yè)表示他們在AI部署方面領(lǐng)先于其他企業(yè)的可能性要高1.5倍,而落后的可能性要低4倍,也就是說使用專業(yè)數(shù)據(jù)供應(yīng)商的企業(yè)部署了更多的AI項目,而且實現(xiàn)了更大的投資回報率。特別是,澳鵬發(fā)現(xiàn)使用專業(yè)數(shù)據(jù)供應(yīng)商的企業(yè)更有可能將AI部署到生產(chǎn)環(huán)境。
此外,AI部署是一個持續(xù)的過程,而不是一勞永逸。去年,80%的被調(diào)研企業(yè)至少每季度更新一次模型,今年已增加到87%;2021 年,57%的受訪者表示至少每月更新一次模型,高于 2020年的45%。而與較小的企業(yè)相比,大型企業(yè)更有可能更新AI模型,至少每季度更新一次的比例為91%。其中,使用專業(yè)數(shù)據(jù)供應(yīng)商的企業(yè)最有可能每月更新其模型。
就中國市場來說,以數(shù)據(jù)標(biāo)注為代表的專業(yè)數(shù)據(jù)服務(wù)行業(yè)才剛剛起步,相關(guān)技術(shù)發(fā)展程度低,屬于勞動力密集型行業(yè),而且該行業(yè)缺乏大型專業(yè)數(shù)據(jù)供應(yīng)商和服務(wù)商,行業(yè)以中小企業(yè)為主,呈現(xiàn)高度的競爭狀態(tài)。在另一方面,數(shù)據(jù)標(biāo)注正從簡單、重復(fù)的拉框標(biāo)注向精細(xì)化方向發(fā)展,也就是說數(shù)據(jù)標(biāo)注行業(yè)正從簡單的勞動力密集型向?qū)I(yè)型數(shù)據(jù)服務(wù)過渡。
當(dāng)前,中國的AI行業(yè)和AI應(yīng)用正在高速發(fā)展,相應(yīng)帶動了AI數(shù)據(jù)標(biāo)注行業(yè)的快速成長。特別是AI用戶對于AI數(shù)據(jù)標(biāo)注質(zhì)量的要求越來越高、越來越精細(xì)化和專業(yè)化,諸如自動駕駛、工業(yè)制造等智能應(yīng)用場景越來越復(fù)雜,高質(zhì)量、精細(xì)化的標(biāo)注數(shù)據(jù)將直接影響算法模型的效果。
專業(yè)化的AI訓(xùn)練數(shù)據(jù)標(biāo)注平臺及眾包管理平臺是當(dāng)前中國AI工業(yè)化瓶頸的重要突破口之一,這也是澳鵬(Appen)進入中國市場的重要原因。澳鵬迄今已經(jīng)有25年的歷史,擁有業(yè)內(nèi)先進的人工智能輔助數(shù)據(jù)標(biāo)注平臺和一體化AI數(shù)據(jù)及資源管理平臺,以及全球100多萬名技能嫻熟的眾包資源 -- 來自全球170多個國家和70,000個地區(qū),支持235多種語言和方言。澳鵬中國團隊從2019年就開始就重新構(gòu)建面向中國市場的AI數(shù)據(jù)標(biāo)注平臺、相應(yīng)的工具以及眾包資源渠道和管理平臺,2021年澳鵬大中華區(qū)正式成立并獨立運作。
作為全球領(lǐng)先的AI訓(xùn)練數(shù)據(jù)服務(wù)提供商,澳鵬的拳頭產(chǎn)品和服務(wù)就是數(shù)據(jù)標(biāo)注平臺和眾包資源。針對中國市場,澳鵬中國研發(fā)中心借鑒公司在海外的實戰(zhàn)經(jīng)驗,重新獨立開發(fā)了中國版本的數(shù)據(jù)服務(wù)平臺。