當(dāng)前位置：首頁 > 智能硬件 > 人工智能AI

AI和機器學(xué)習(xí)存在什么算法偏見

時間：2020-05-18 12:45:01

關(guān)鍵字： AI 機器學(xué)習(xí) 人工智能相機

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀] 我們又能通過開源社區(qū)做些什么？在我們的世界里，算法無處不在，偏見也是一樣。從社會媒體新聞的提供到流式媒體服務(wù)的推薦到線上購物，計算機算法，尤其是機器學(xué)習(xí)算法，已經(jīng)滲透到我們?nèi)粘Ｉ畹拿?

我們又能通過開源社區(qū)做些什么？

在我們的世界里，算法無處不在，偏見也是一樣。從社會媒體新聞的提供到流式媒體服務(wù)的推薦到線上購物，計算機算法，尤其是機器學(xué)習(xí)算法，已經(jīng)滲透到我們?nèi)粘Ｉ畹拿恳粋€角落。至于偏見，我們只需要參考 2016 年美國大選就可以知道，偏見是怎樣在明處與暗處影響著我們的社會。

很難想像，我們經(jīng)常忽略的一點是這二者的交集：計算機算法中存在的偏見。

與我們大多數(shù)人的認(rèn)知相反，科技并不是客觀的。 AI算法和它們的決策程序是由它們的研發(fā)者塑造的，他們寫入的代碼，使用的“訓(xùn)練”數(shù)據(jù)還有他們對算法進(jìn)行應(yīng)力測試的過程，都會影響這些算法今后的選擇。這意味著研發(fā)者的價值觀、偏見和人類缺陷都會反映在軟件上。如果我只給實驗室中的人臉識別算法提供白人的照片，當(dāng)遇到不是白人照片時，它不會認(rèn)為照片中的是人類。這結(jié)論并不意味著 AI 是“愚蠢的”或是“天真的”，它顯示的是訓(xùn)練數(shù)據(jù)的分布偏差：缺乏多種的臉部照片。這會引來非常嚴(yán)重的后果。

這樣的例子并不少。全美范圍內(nèi)的州法院系統(tǒng) 都使用“黑盒”對罪犯進(jìn)行宣判。由于訓(xùn)練數(shù)據(jù)的問題，這些算法對黑人有偏見，他們對黑人罪犯會選擇更長的服刑期，因此監(jiān)獄中的種族差異會一直存在。而這些都發(fā)生在科技的客觀性偽裝下，這是“科學(xué)的”選擇。

美國聯(lián)邦政府使用機器學(xué)習(xí)算法來計算福利性支出和各類政府補貼。但這些算法中的信息，例如它們的創(chuàng)造者和訓(xùn)練信息，都很難找到。這增加了政府工作人員進(jìn)行不平等補助金分發(fā)操作的幾率。

算法偏見情況還不止這些。從 Facebook 的新聞算法到醫(yī)療系統(tǒng)再到警用攜帶相機，我們作為社會的一部分極有可能對這些算法輸入各式各樣的偏見、性別歧視、仇外思想、社會經(jīng)濟地位歧視、確認(rèn)偏誤等等。這些被輸入了偏見的機器會大量生產(chǎn)分配，將種種社會偏見潛藏于科技客觀性的面紗之下。

這種狀況絕對不能再繼續(xù)下去了。

在我們對人工智能進(jìn)行不斷開發(fā)研究的同時，需要降低它的開發(fā)速度，小心仔細(xì)地開發(fā)。算法偏見的危害已經(jīng)足夠大了。

我們能怎樣減少算法偏見？

最好的方式是從算法訓(xùn)練的數(shù)據(jù)開始審查，根據(jù)微軟的研究人員所說，這方法很有效。

數(shù)據(jù)分布本身就帶有一定的偏見性。編程者手中的美國公民數(shù)據(jù)分布并不均衡，本地居民的數(shù)據(jù)多于移民者，富人的數(shù)據(jù)多于窮人，這是極有可能出現(xiàn)的情況。這種數(shù)據(jù)的不平均會使 AI 對我們是社會組成得出錯誤的結(jié)論。例如機器學(xué)習(xí)算法僅僅通過統(tǒng)計分析，就得出“大多數(shù)美國人都是富有的白人”這個結(jié)論。

即使男性和女性的樣本在訓(xùn)練數(shù)據(jù)中等量分布，也可能出現(xiàn)偏見的結(jié)果。如果訓(xùn)練數(shù)據(jù)中所有男性的職業(yè)都是 CEO，而所有女性的職業(yè)都是秘書（即使現(xiàn)實中男性 CEO 的數(shù)量要多于女性），AI 也可能得出女性天生不適合做 CEO 的結(jié)論。

同樣的，大量研究表明，用于執(zhí)法部門的 AI 在檢測新聞中出現(xiàn)的罪犯照片時，結(jié)果會驚人地偏向黑人及拉丁美洲裔居民。

在訓(xùn)練數(shù)據(jù)中存在的偏見還有很多其他形式，不幸的是比這里提到的要多得多。但是訓(xùn)練數(shù)據(jù)只是審查方式的一種，通過“應(yīng)力測驗”找出人類存在的偏見也同樣重要。

如果提供一張印度人的照片，我們自己的相機能夠識別嗎？在兩名同樣水平的應(yīng)聘者中，我們的AI是否會傾向于推薦住在市區(qū)的應(yīng)聘者呢？對于情報中本地白人恐怖分子和伊拉克籍恐怖分子，反恐算法會怎樣選擇呢？急診室的相機可以調(diào)出兒童的病歷嗎？

這些對于AI來說是十分復(fù)雜的數(shù)據(jù)，但我們可以通過多項測試對它們進(jìn)行定義和傳達(dá)。

為什么開源很適合這項任務(wù)？

開源方法和開源技術(shù)都有著極大的潛力改變算法偏見。

現(xiàn)代人工智能已經(jīng)被開源軟件占領(lǐng)，TensorFlow、IBM Watson 還有 scikit－learn 這類的程序包都是開源軟件。開源社區(qū)已經(jīng)證明它能夠開發(fā)出強健的，經(jīng)得住嚴(yán)酷測試的機器學(xué)習(xí)工具。同樣的，我相信，開源社區(qū)也能開發(fā)出消除偏見的測試程序，并將其應(yīng)用于這些軟件中。

調(diào)試工具如哥倫比亞大學(xué)和理海大學(xué)推出的 DeepXplore，增強了 AI 應(yīng)力測試的強度，同時提高了其操控性。還有麻省理工學(xué)院的計算機科學(xué)和人工智能實驗室完成的項目，它開發(fā)出敏捷快速的樣機研究軟件，這些應(yīng)該會被開源社區(qū)采納。

開源技術(shù)也已經(jīng)證明了其在審查和分類大組數(shù)據(jù)方面的能力。最明顯的體現(xiàn)在開源工具在數(shù)據(jù)分析市場的占有率上（Weka、Rapid Miner 等等）。應(yīng)當(dāng)由開源社區(qū)來設(shè)計識別數(shù)據(jù)偏見的工具，已經(jīng)在網(wǎng)上發(fā)布的大量訓(xùn)練數(shù)據(jù)組比如 Kaggle 也應(yīng)當(dāng)使用這種技術(shù)進(jìn)行識別篩選。

開源方法本身十分適合消除偏見程序的設(shè)計。內(nèi)部談話、私人軟件開發(fā)及非民主的決策制定引起了很多問題。開源社區(qū)能夠進(jìn)行軟件公開的談話，進(jìn)行大眾化，維持好與大眾的關(guān)系，這對于處理以上問題是十分重要的。如果線上社團，組織和院校能夠接受這些開源特質(zhì)，那么由開源社區(qū)進(jìn)行消除算法偏見的機器設(shè)計也會順利很多。

我們怎樣才能夠參與其中？

教育是一個很重要的環(huán)節(jié)。我們身邊有很多還沒意識到算法偏見的人，但算法偏見在立法、社會公正、政策及更多領(lǐng)域產(chǎn)生的影響與他們息息相關(guān)。讓這些人知道算法偏見是怎樣形成的和它們帶來的重要影響是很重要的，因為想要改變目前的局面，從我們自身做起是唯一的方法。

對于我們中間那些與人工智能一起工作的人來說，這種溝通尤其重要。不論是人工智能的研發(fā)者、警方或是科研人員，當(dāng)他們?yōu)榻窈笤O(shè)計人工智能時，應(yīng)當(dāng)格外意識到現(xiàn)今這種偏見存在的危險性，很明顯，想要消除人工智能中存在的偏見，就要從意識到偏見的存在開始。

最后，我們需要圍繞 AI 倫理化建立并加強開源社區(qū)。不論是需要建立應(yīng)力實驗訓(xùn)練模型、軟件工具，或是從千兆字節(jié)的訓(xùn)練數(shù)據(jù)中篩選，現(xiàn)在已經(jīng)到了我們利用開源方法來應(yīng)對數(shù)字化時代最大的威脅的時間了。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風(fēng)險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]