2017年,一款皂液分發(fā)器走紅網(wǎng)絡:在推特用戶Chukwuemeka Afigbo上傳的視頻中,一位白人男性在分發(fā)器下方揮手,皂液正常流出;而黑皮膚的手放到分發(fā)器下時,機器卻毫無反應。這兩個人交談著,再一次測試這臺冒犯人的、樂柏美商務用品出品的機器。一人問:“你的手怎么回事?”另一個回答說:“太黑了?!?/p>
他說的也有道理。皂液分發(fā)器通過紅外發(fā)光二極管燈泡發(fā)射不可見光,接收手的反射光啟動機器。膚色較暗的人吸收的光多于反射的光,因此阻礙了皂液分發(fā)器的正常工作。
這則視頻在全球廣泛流傳,被分享成百上千次,也激起不少民憤;這告訴了我們一個簡單的道理:不同于長期以來技術(shù)推動人類進步的說法,技術(shù)仍然存在種族差異。
技術(shù)在娛樂應用程序里的失敗技術(shù)應用是一回事,但環(huán)顧四周會發(fā)現(xiàn),生活中常用的技術(shù)出現(xiàn)種族差異是另一回事。如果你懷疑世界建立之初就只考慮到了白人,不妨看看新一輪技術(shù)熱潮是如何在早期開發(fā)過程中忽略“有色人種”的。
開發(fā)者承擔了大部分責任,同時科技初創(chuàng)公司正嘗試填補硅谷及其他地區(qū)“白人男性”開發(fā)者留下的空缺。到了2017年,開發(fā)人員自主研發(fā)不再是什么新鮮事,但讓技術(shù)忽略大部分全球人口,無非是個虧本買賣。有關(guān)新聞(附帶視頻)報道了一名劉姓中國學生的iPhone X面部識別功能如何無法分辨他和他的母親。技術(shù)的失誤帶來的安全隱患僅僅基于種族問題。
膚色問題在面部識別軟件中的無能表現(xiàn)得更為嚴峻:后者在遇到執(zhí)法過程中無法擺脫對黑人面孔的無意識偏見。Alexandria Ocasio-Cortez議員于五月就亞馬遜和移民和海關(guān)執(zhí)法局(ICE)對眾議院監(jiān)管委員會(House Oversight Committee)提出質(zhì)詢,她指出,“這些算法的有效程度因人而異”,并進一步提問,它對女性、有色人種和不同性別是否有效。得到回應均為否定時,她提出了一個尖刻的問題:這些算法對誰最有效?回答很簡短:“肯定是白人男性?!?/p>
今年,也許最令人擔憂的是一份Georgia Tech的報告,該報告考察了自動駕駛汽車問題,并分析了多種“機器視覺”系統(tǒng)識別不同膚色行人的有效程度。結(jié)果表明,比起較深膚色的人,AI系統(tǒng)更善于識別淺色皮膚的行人,成功識別白人行人的幾率比黑人高出10%。另一份近期的報告指出,F(xiàn)itbit等可穿戴心率追蹤器在有色人種身上不太靠譜,因為它利用了一種極易被黑色素吸收的綠光。
無數(shù)實例表明,技術(shù)設計忽視種族是當今社會的“時興”問題。長期以來,世界的發(fā)展就沒有考慮過有色人種,現(xiàn)在隨著朝AI和自動化方向的變革,未來似乎仍沒有顧及這群人。盡管自動化汽車和面部識別遠未在全球范圍內(nèi)普及,此時此刻,人們?nèi)粘I钪衅毡槭褂玫募夹g(shù)正在他們的口袋里傳達著有關(guān)種族優(yōu)越的信息。
“iPhone里的Siri是我現(xiàn)在唯一常用的技術(shù),我主要用它識別像‘帶我回家’之類的基礎(chǔ)句子,”Julian Mendel在Facetime上說,“但有幾次它聽到我的聲音后沒有反應或壓根沒聽懂我在說什么?!?/p>
憑借自己在牙買加長大、近期移居美國的經(jīng)歷,用戶Julian Mendel正用(英國人聽來)濃重的牙買加口音外加美式鼻音解釋Siri的用戶體驗?!拔矣X得我的確在用一個不同的聲音和Siri說話,因為它絕對聽不懂方言。我不認為牙買加那邊有這種東西,所以我堅信這種技術(shù)還有很長一段路要走。對很多人而言,它幾乎沒什么作用。很多人能夠支付技術(shù)的費用,卻沒辦法使用它,因為平常大家會說方言?!?/p>
有色人種為了被人理解而采用更清晰(意作:更接近白人)的語音屢見不鮮,但讓一些人為新技術(shù)而順應白人的語音習慣至少可以說是令人沮喪的。畢竟,根據(jù)口音縮小市場的技術(shù)能有多有效呢?
Mendel不是唯一受這類問題困擾的人。我和帶有濃重的印度、韓國和西班牙口音的人交談過,他們都表示遇到過類似情況。何況還有其他沒有說到的語言。所以,有沒有方法解決這個讓一部分全球人口無法使用技術(shù)的問題嗎?
在多倫多的Collision(北美最大的技術(shù)會議)會場上,Mozilla的創(chuàng)意總監(jiān)Katharina Borchert正面對200名聽眾。她展示的主題是:用語音數(shù)據(jù)彌補市場的空白。她穿著時髦,有一頭栗色的頭發(fā),戴眼鏡,說著一口帶德語鼻音的口音,Borchert正在解釋技術(shù)公司代表的“白皮膚的陳舊男性”壟斷勢力如何怠慢被她稱為來自“新興市場”的人群。她強調(diào)了很多人已經(jīng)知道的事實:語音識別不能滿足有口音或非英語母語者的需求(她指出,即使像中文普通話一樣的通用語言也以男性語音為主)。她倡導Common Voice,一個意在通過收集個體聲音作為數(shù)據(jù)集,促進A.I.語音多樣化的項目。點擊Common Voice,錄制諸如“所有房子都由木材建成”,或“帶有種族成見的各種民族恐慌和偏見”等句子貢獻語音。
“我們意識到,數(shù)據(jù)生態(tài)系統(tǒng)十分閉塞,因為總是那么幾個大公司擁有訓練數(shù)據(jù)集,”Borchert結(jié)束演講后在茶歇時間說,“蘋果、亞馬遜、谷歌、Nuance和微軟,你可以利用它們的數(shù)據(jù)集,也可以利用亞馬遜Alexa的技能,但這些對于像Mozilla這樣有使命感、重視開放式網(wǎng)絡、立志創(chuàng)造充滿機遇的生態(tài)系統(tǒng)的公司來說,規(guī)模就遠遠不夠?!?/p>
“我們從幾年前開始開發(fā)語音識別的公司那里得知,他們通常將公共電臺的聲音收錄到數(shù)據(jù)集中,這樣就不必太擔心版權(quán)問題。這些音頻大多來自說母語、接受過發(fā)聲訓練的男性,所以最后得到的語音是清晰的,因為數(shù)據(jù)集里大部分聲音都如此。自然而然會導致不公正的結(jié)果,因為數(shù)據(jù)就那些。收集的女聲不多,更沒有夸張口音。這就是為什么早期版本在識別女性聲音方面有很大的問題,因為女性音調(diào)與男性的不同。所以,講話人語音越多樣,數(shù)據(jù)從長遠來講質(zhì)量也越好?!?/p>
這種方法存在一些問題——數(shù)據(jù)集的大小取決于講話人參與的積極性,人們還會擔心收集數(shù)據(jù)的用途。Borchert目前正與從柏林到盧旺達大大小小的社區(qū)合作;在東非地區(qū),人們自然會懷疑白人“創(chuàng)意執(zhí)行官”為什么要找東非原住民錄制聲音。“當然,找到愿意說英語的人比找到愿意說盧旺達語的人容易很多,因為掌握后者的人數(shù)更少?!彼忉尩馈!八杂⒄Z的數(shù)據(jù)容量比其他語言更容易擴大,不過我認為具體實施還要看社區(qū)積極性和參與度?!?/p>
Borchert也認識到,人們在不知道這些數(shù)據(jù)的最終去向時,是不愿意提供聲音信息的。(Borchert保證,其條款是數(shù)據(jù)不被非法使用的保障,所有語音數(shù)據(jù)均會匿名,無法分辨其中的個人信息)
“我們不想擁有所有數(shù)據(jù)”她強調(diào),“我們不想構(gòu)建所有語音系統(tǒng)。我希望我們能引發(fā)下一波語音平臺創(chuàng)新的熱潮。我母親的英語有濃重的德語口音,她能使用德語版本的Amazon Echo,但她用不了英語版本,也不能用Siri……我的父親不會用英語和Siri對話。
她辯稱,收集到的數(shù)據(jù)不僅可以用于養(yǎng)老,理想條件下,還可以用于移動醫(yī)療,無需打字就可以問一些簡單的問題。顯然這樣的項目除了調(diào)節(jié)語音的平衡,還能成為政治活動的工具。Borchert回憶了近期發(fā)生的一件事:政治活動家和高校人員共同將加泰羅尼亞語和威爾士語的語音引入項目,當時正為這兩種語言即將失傳而擔憂的政治氛圍中。
Common Voice的進程漫長而艱辛。但它提供了很好的企業(yè)方案,有望借助大家的聲音反抗現(xiàn)有種族格局,大大改變?nèi)蚨鄶?shù)老齡化人口使用技術(shù)的方式。但見證真正的改變發(fā)生還需要對企業(yè)的部署結(jié)構(gòu)進行根本性的改革,必須用現(xiàn)在的問題重新設定未來。在未來世界里,人們的技術(shù)將源自日常生活。
目前,我們只做到了第一步,即認識到技術(shù)的種族差異。這或許聽起來難以接受,但如果你是正在爭取技術(shù)獲取權(quán),希望在家庭日常生活中使用AI的有色人種來說,你比世界上的其他人更難找到方向——假裝白人的語音,把白色餐巾偷偷放在皂液分發(fā)器下,失去養(yǎng)老的機會,承擔比白人行人更高的風險,可能是你未來短期內(nèi)需要面對的境況。
來源:搜狐