臉書人工智能背后的人工:將用戶私人數(shù)據(jù)標(biāo)注外包給了印度人
臉書人工智能背后的人工:將用戶私人數(shù)據(jù)標(biāo)注外包給了印度人
引領(lǐng)智能科技發(fā)展的Facebook(臉書),也有不智能的一面。為了更好地訓(xùn)練自家的人工智能(AI)系統(tǒng),F(xiàn)acebook將用戶私人社交內(nèi)容標(biāo)注工作外包給了印度合同工。這樣的行為也引發(fā)了大眾對(duì)于Facebook數(shù)據(jù)安全的討論。
對(duì)于數(shù)據(jù)標(biāo)注工,許多人或許并不陌生。像許多科技公司一樣,F(xiàn)acebook使用機(jī)器學(xué)習(xí)和AI系統(tǒng)在其平臺(tái)上對(duì)內(nèi)容進(jìn)行排序。但為了做到這一點(diǎn),需要對(duì)軟件進(jìn)行訓(xùn)練,以識(shí)別不同類型的內(nèi)容。為了訓(xùn)練這些算法,科技公司必須分析樣本數(shù)據(jù),所有這些都需要由人類進(jìn)行分類和標(biāo)記。這些人是人工智能背后的人工,也被稱為智能時(shí)代背后的隱形者。
據(jù)路透社報(bào)道,F(xiàn)acebook將部分的數(shù)據(jù)標(biāo)注工作外包給了印度公司W(wǎng)iPro。該公司雇用了260多名工人,以五個(gè)類別對(duì)用戶發(fā)布的私人帖子進(jìn)行標(biāo)注。例如,帖子的內(nèi)容(是自拍或食物圖片)、場(chǎng)合(是生日還是婚禮)、作者的意圖(他們是開個(gè)玩笑,試圖激勵(lì)他人,還是組織一個(gè)聚會(huì))。為了保證數(shù)據(jù)標(biāo)注的準(zhǔn)確性,每條內(nèi)容由WiPro的兩名工人檢查準(zhǔn)確性,每個(gè)工人每天注釋大約700條內(nèi)容。
Facebook確認(rèn)了WiPro的工作,并表示W(wǎng)iPro工人正在檢查和標(biāo)注的內(nèi)容包括選定數(shù)量的用戶私人共享內(nèi)容,其中部分?jǐn)?shù)據(jù)包含用戶姓名和其他敏感信息。同時(shí),F(xiàn)acebook表示,公司在全球范圍里有200個(gè)類似的項(xiàng)目,總共雇傭了數(shù)千人。盡管Facebook表示,外包出去的數(shù)據(jù)標(biāo)注工作得到了公司法律和隱私團(tuán)隊(duì)的批準(zhǔn),但鑒于Facebook之前在數(shù)據(jù)安全上的表現(xiàn),許多用戶仍表示擔(dān)憂。
在人工智能時(shí)代,對(duì)于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等算法來說,數(shù)據(jù)量越大、質(zhì)量越好,算法模型就表現(xiàn)越好??梢哉f,數(shù)據(jù)決定著整個(gè)人工智能行業(yè)的發(fā)展態(tài)勢(shì)。Facebook人工智能產(chǎn)品管理總監(jiān)Nipun Mathur認(rèn)為,這類工作是人工智能的核心。
但標(biāo)注工作本身是一個(gè)勞動(dòng)密集型工種,收入也不高,聽上去有點(diǎn)像呼叫中心的工作。因此,大部分的公司將這類工作外包給了人工較為便宜的國(guó)家。在中國(guó),也有大量的“數(shù)據(jù)標(biāo)注者”每天對(duì)著電腦,標(biāo)記供自動(dòng)駕駛汽車學(xué)習(xí)的圖像,以便訓(xùn)練他們識(shí)別自行車和行人。
為了更好的智能化,數(shù)據(jù)標(biāo)注工作是必要的,但當(dāng)標(biāo)記的數(shù)據(jù)涉及到用戶個(gè)人隱私時(shí),問題就來了。比如前段時(shí)間鬧得沸沸揚(yáng)揚(yáng)的某購(gòu)物App竊聽事件,許多用戶懷疑該應(yīng)用程序監(jiān)控或是竊聽了自己的社交內(nèi)容,從而生成推薦商品推送給了自己。
當(dāng)你和你的朋友交談聊天時(shí),你不認(rèn)為有其他人會(huì)聽到你們的談話,但現(xiàn)在這變成了可能。尤其是當(dāng)大公司將你的數(shù)據(jù)外包給那些采用更低安全標(biāo)準(zhǔn)和隱私的公司時(shí),問題變得令人更加不安。