為何說人工智能是無差別的人力,天壤之別準(zhǔn)確度?
開玩笑的時(shí)候,小雪說她的男友是AI產(chǎn)業(yè)中工資最低的那個(gè),其次就是她自己。
剛從濟(jì)南德州信息工程學(xué)校計(jì)算機(jī)專業(yè)畢業(yè),小雪和男友正在接受手寫體錄入培訓(xùn),當(dāng)她能認(rèn)識這些手寫字母后,就輪到她把這些知識教給計(jì)算機(jī)——把一張張快遞單或家譜上的手寫體上的字母標(biāo)注出來,告訴機(jī)器i可以有多種寫法。
這樣的工作并不簡單。手寫的i可能是頂上一點(diǎn)加上一豎,也可能是朝后彎的小勾,更潦草一點(diǎn)就和數(shù)字9一樣……小雪的筆記本上密密麻麻地?cái)D滿了這些像字更像圖的墨跡。
小雪做的,是一種介于手寫錄入和圖像標(biāo)記之間的工作。同服務(wù)于智能駕駛的街景標(biāo)記、服務(wù)于智能醫(yī)療的人體標(biāo)記、服務(wù)于語音交互的聲音標(biāo)記一樣,他們共同的行業(yè)學(xué)名叫做“人工智能數(shù)據(jù)標(biāo)注”——這是整個(gè)AI產(chǎn)業(yè)的基礎(chǔ),是機(jī)器感知現(xiàn)實(shí)世界原點(diǎn)。
和小孩一樣,機(jī)器要認(rèn)識“蘋果”,就需要不斷有人教給它哪些東西是蘋果:渾圓的、帶把的、有的像桃心有的像屁股,有的通紅有的油綠。和小孩不同的是,機(jī)器需要在不同場景、不同角度下反復(fù)學(xué)習(xí),這個(gè)漫長的教授過程就是小雪在AI產(chǎn)業(yè)中的位置,標(biāo)注大量用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù),讓機(jī)器越來越像“人”。
無差別的人力,天壤之別準(zhǔn)確度
如果小雪標(biāo)注犯錯(cuò),最直接的后果是機(jī)器也會跟著犯錯(cuò)。她必須保證“喂”給機(jī)器的標(biāo)注數(shù)據(jù)達(dá)到90%以上精度(即是指標(biāo)注的正確率),否則這些數(shù)據(jù)對于機(jī)器學(xué)習(xí)將毫無意義。北京一家數(shù)據(jù)標(biāo)注工廠BasicFinder的CEO杜霖說:95%以上的準(zhǔn)確率是理想情況;但從95%提到97%所需花的成本就不再是一兩倍了,可能是10倍或100倍。
98%精度是小雪遇到過的最高需求,這意味著如果100個(gè)點(diǎn)里頭有兩個(gè)點(diǎn)不準(zhǔn)的話,就會被打回重做。她“提心吊膽”地對每個(gè)標(biāo)注點(diǎn)反復(fù)確認(rèn)才敢提交。但15骨骼點(diǎn)標(biāo)注又極耗耐心,要在人全身包括頭頂、脖子、胸口、膝蓋等骨骼處打上15個(gè)點(diǎn),將這15個(gè)點(diǎn)連起來就出現(xiàn)了一個(gè)形象的火柴人。在Kinect體感游戲中,機(jī)器就是靠關(guān)鍵骨骼點(diǎn)的位移來識別人體是否運(yùn)動。
令小雪最郁悶的,是一張軍姿站圖。只要露出了頭、脖子、胸口,小雪就要從他的左上角開始畫矩形,框住這些動作、著裝完全一致的人。重復(fù)拖動近40個(gè)框后,她要再放大這些帶有藍(lán)色陰影矩形框,從頭到四肢標(biāo)注完每個(gè)人的骨骼點(diǎn)。最后,將近600個(gè)點(diǎn)密密麻麻地落在了這張圖里。
在這個(gè)她形容為“經(jīng)歷絕望”的過程中,她嘗試用眼藥水來緩解疲勞,但滴過后會不停流眼淚,直到她換了種方式,靠不停揉眼睛來放松。杜霖說:有些任務(wù)圖上密密麻麻的點(diǎn),看兩個(gè)小時(shí)以上眼睛絕對會花掉了,但他會要求員工不斷克服人本身的一些“消極因素”,才能避免標(biāo)錯(cuò)數(shù)據(jù)成為“漏網(wǎng)之魚”。
聯(lián)合國教科文組織信息與傳播知識社會局主任英德拉吉特·班納吉認(rèn)為,到2030年,人工智能將向世界經(jīng)濟(jì)貢獻(xiàn)16萬億美元。從2016年人工智能逐漸走熱以來,任何行業(yè)都想搭上這個(gè)熱潮,投資人的評價(jià)是“每個(gè)商業(yè)計(jì)劃書上都要加上人工智能”。進(jìn)入深度學(xué)習(xí)“死胡同”的人工智能需要標(biāo)注的領(lǐng)域也帶來越來越多:機(jī)場安檢時(shí)新增的人臉識別、能識別選取商品的無人便利店、能安全行駛的無人駕駛等。
新興市場帶來了大量勞動力的涌入?!霸瓉砀商詫毸蔚?,現(xiàn)在也能搖身一變做AI數(shù)據(jù)標(biāo)注?!倍帕卣f,“在提供無差別人力勞動這件事上,大家是沒有門檻的?!?/p>
在河北衡水,由于當(dāng)?shù)卣槲廴緡?yán)重導(dǎo)致化工制品停產(chǎn),26歲的小蘇就帶著原先30多人的銷售團(tuán)隊(duì)轉(zhuǎn)行數(shù)據(jù)標(biāo)注,隊(duì)員小的到20出頭,老至年近不惑。雖然他早就知道河北做數(shù)據(jù)標(biāo)注的團(tuán)隊(duì)已經(jīng)非常多,并且有的團(tuán)隊(duì)已經(jīng)垮掉,但人工智能的火熱和數(shù)據(jù)標(biāo)注的低門檻還是讓他決定一搏。
高中學(xué)歷是小蘇在招人時(shí)的最高期望,“高中生花一天做的工作,初中生可能需要花五天,差別很大。”行業(yè)中,小蘇的招聘標(biāo)準(zhǔn)已經(jīng)算是較高水平,那些投身數(shù)據(jù)標(biāo)注的兼職者學(xué)歷更加良莠不齊。在某些眾包平臺上,有的標(biāo)注者只有小學(xué)文憑,在東北還有一部分有聽力障礙的殘疾人標(biāo)注團(tuán)隊(duì),而北京的全職工廠中的最高學(xué)歷是大?;蛘咧袑?。
欣博友數(shù)據(jù)標(biāo)注公司市場部經(jīng)理周京平認(rèn)為,一個(gè)老農(nóng)民在標(biāo)注方言語音時(shí)可能會比不使用這種語言的大學(xué)生還好。同所有的人力密集型產(chǎn)業(yè)一樣,人人都能在此覓得一份營生。
人工智能專業(yè)方向的碩士生毛毛認(rèn)為,能不能達(dá)到理想標(biāo)注精度和學(xué)歷沒什么關(guān)系,而且操作非常簡單,只要教一下,誰都能做。她也曾做過兼職數(shù)據(jù)標(biāo)注,在所給的圖片中她需要辨別出不同角度的花菜、菠菜等。一星期后,她標(biāo)注了一萬張圖,沒有一張返工,每張報(bào)酬一毛錢。但她“打死也不會再做這個(gè)工作了”,因?yàn)椤皩?shí)在太重復(fù)”。
看似簡單的操作,要達(dá)到90%的精度對于大多數(shù)標(biāo)注者來講卻是天方夜譚。小蘇所接觸到的兼職標(biāo)注團(tuán)隊(duì)最高精度只能達(dá)到70%,即便是在全職和全把控的情況下,他們第一次項(xiàng)目只達(dá)到了50%的精度,基本上承接的每個(gè)項(xiàng)目他們都需要重復(fù)三次以上才能達(dá)到90%的精度。
如果用于訓(xùn)練模型的數(shù)據(jù)精度低于90%,就像小孩兒拿到的一年級數(shù)學(xué)課本里頭寫的是一加一等于三。一開始就教錯(cuò),機(jī)器學(xué)習(xí)和人工智能就只剩下指鹿為馬。
數(shù)字富士康
2014年冬天,山東蓬萊積起了厚厚的雪。小雪每天都要不情愿地鉆出被窩,趟著大雪走到一家汽車工廠去插線。在固定工位站好后,她根據(jù)形狀將面前充滿不同插口的集成器及一堆接口各異的汽車線路一一匹配好,完成后迅速將其交給下一個(gè)人,再重復(fù)剛才的動作,直到下班。小雪知道,自己站一整天的工作只是整個(gè)工廠里頭很小的一部分。
相比那年冬天,她更喜歡現(xiàn)在的工作,數(shù)據(jù)標(biāo)注工廠里,她有接近兩百個(gè)同事,大家能坐在屬于自己的工位上干活。在給用于智能駕駛采集的圖片做標(biāo)注時(shí),小雪需要選取一個(gè)可以畫出2D框的標(biāo)注工具(即是可以根據(jù)不同物體拖動出不同形狀的畫框),把圖片中所有的機(jī)動車、非機(jī)動車、行人、紅綠燈等標(biāo)注出來。
同在汽車工廠流水線上的工作相比,眼前的鍵盤鼠標(biāo)顯示器替代了嗡嗡作響的流水線,從早上8點(diǎn)到晚上5點(diǎn),小雪除了拽動鼠標(biāo)外什么都不用想,重復(fù)一個(gè)動作就行,變化的只有眼前不同的圖片——但這對小雪來說,工作中的新鮮感已經(jīng)足夠。
有的人說數(shù)據(jù)標(biāo)注工廠就像富士康一樣。北京另一家數(shù)據(jù)標(biāo)注公司瑪達(dá)科技公司CEO任樹亮則直言不諱,數(shù)據(jù)這一塊往往給人印象就是一個(gè)勞動密集型產(chǎn)業(yè)。某自動駕駛創(chuàng)業(yè)公司數(shù)據(jù)標(biāo)注負(fù)責(zé)人經(jīng)常私底下開玩笑說,這就是個(gè)“血汗工廠”。
目前的數(shù)據(jù)標(biāo)注工廠,多集中在河北、河南、山東、山西等地區(qū),這同以富士康為代表的傳統(tǒng)人力密集企業(yè)的選址偏好重合度極高——以更低廉的勞動力成本支撐起聚集在首都的人工智能底層數(shù)據(jù)需求。杜霖介紹說,由于高昂的成本絕不能讓北京去做最終的生產(chǎn),而是做所有新任務(wù)來時(shí)的磨合測試以及最終的質(zhì)量控制。生產(chǎn)任務(wù)最終還是落到周邊城市。
只有招募像毛毛一樣的大學(xué)生做兼職標(biāo)注時(shí),眾包工廠能開出一張圖1毛錢“高價(jià)”。任樹亮對這樣的定價(jià)有些吃驚,“我們還有按厘算的呢?!痹谝欢巡煌瑘D片中識別某人是否是同一個(gè)人,這樣的工作只能按厘算,不過也有從幾十塊錢到上百塊錢報(bào)價(jià)的復(fù)雜標(biāo)注圖。杜霖說,圖片的差異比較大,以工時(shí)來計(jì)算可能更準(zhǔn)確,現(xiàn)在甲方公司至少應(yīng)該給到30塊錢每小時(shí)才能保質(zhì)保量完成。
小雪挺滿意現(xiàn)在的待遇,“之前的工作太累又掙不到錢”?,F(xiàn)在公司包吃包住,提供四人間寢室,一個(gè)月到手的工資有4000-5000塊,還可以和男朋友一同上下班。最近一段時(shí)間,工期趕得很急,小雪已經(jīng)連續(xù)兩個(gè)周末到公司加班,從早到晚地盯著顯示器讓她倍感疲憊,但她不想停下,基礎(chǔ)加計(jì)件的工資構(gòu)成總是多勞多得。
和傳統(tǒng)生產(chǎn)流水線不同的是,在杜霖的工廠里,工作流程被設(shè)置為可實(shí)時(shí)切換:每期作業(yè)都不同,每期作業(yè)里頭的每個(gè)任務(wù)也不相同。在一個(gè)小時(shí)的工作間隔里,小雪會碰到兩個(gè)相同的標(biāo)注任務(wù),當(dāng)兩次標(biāo)注結(jié)果差別較大時(shí),就證明她已經(jīng)疲勞了,這是,系統(tǒng)就會切換一個(gè)完全不同的任務(wù)交給小學(xué)操作,以保持員工的“清醒”和“新鮮”,最終達(dá)成杜霖宣稱的準(zhǔn)確率。
算上合作的周邊工廠,杜霖的公司已經(jīng)有2000多人,他們正在同時(shí)進(jìn)行著20多個(gè)不同項(xiàng)目的標(biāo)注。在這樣一個(gè)人力密集型行業(yè)里存活下來,并且保障交付的數(shù)據(jù)達(dá)到90%的精度,他堅(jiān)信,管理才是關(guān)鍵。
管理,管理,以及管理
林霞是小雪的直接管理者,她是老板杜霖最信任的人,已經(jīng)有18年類似的工作經(jīng)驗(yàn)。當(dāng)接到一個(gè)新項(xiàng)目時(shí),她要確定整個(gè)項(xiàng)目流程。前
[1] [2]