對(duì)于人工智能真正的人類智慧才是核心
微軟宣布將與研究實(shí)驗(yàn)室OpenAI合作,投資10億美元打造“通用人工智能”(AGI)。OpenAI 首席執(zhí)行官 Sam Altman表示:“強(qiáng)人工智能的研發(fā)將是人類歷史上最重要的技術(shù)進(jìn)步?!北娝苤?u>計(jì)算機(jī)在一些具體任務(wù)的處理上遠(yuǎn)超人類,但它們并不具有人類智慧、常識(shí)以及批判性思維,在不明確的條件下它們往往很難執(zhí)行任務(wù),作出判斷或選擇。因此,開(kāi)發(fā)出類似于人腦的計(jì)算機(jī)將會(huì)是巨大的進(jìn)步,然而微軟在這方面的嘗試似乎也并不讓人滿意。
通用人工智能也許只是一個(gè)虛幻的夢(mèng)想,不過(guò)數(shù)據(jù)科學(xué)企圖依靠大數(shù)據(jù)和強(qiáng)大的計(jì)算功能,讓計(jì)算機(jī)根據(jù)事實(shí)做出明智的決策,而不是依賴人類的一時(shí)興起、預(yù)感或偏見(jiàn)。然而實(shí)際情況是,企業(yè)和政府依舊犯著大數(shù)據(jù)時(shí)代之前的那些錯(cuò)誤。因?yàn)閷⒅卮鬀Q策交給計(jì)算機(jī)只會(huì)重復(fù)曾經(jīng)的錯(cuò)誤判斷。
數(shù)據(jù)科學(xué)不僅僅是數(shù)學(xué)證明、統(tǒng)計(jì)計(jì)算和計(jì)算機(jī)編程。實(shí)驗(yàn)設(shè)計(jì)、人類智慧、常識(shí)、懷疑和批判性思維,這些真正的人類智慧才是核心所在。如果數(shù)據(jù)科學(xué)想要發(fā)揮其巨大的潛力,就要避免以下9個(gè)常見(jiàn)的“陷阱”:第一臺(tái)機(jī)械計(jì)算機(jī)的發(fā)明者查爾斯·巴貝奇(Charles Babbage)曾兩次被問(wèn)到:“巴貝奇先生,請(qǐng)問(wèn)如果你把錯(cuò)誤的數(shù)字輸入機(jī)器,會(huì)得出正確的答案嗎?”答案是否定的。
芝加哥一家醫(yī)院曾做過(guò)關(guān)于敗血癥病人的研究,他們認(rèn)為,血液pH值低的患者出院后很快再次入院的概率較低。不過(guò),他們的數(shù)據(jù)包括了在住院期間去世的病人!要知道,最不可能再次入院的病人正是那些躺在太平間里的人。所以,事實(shí)上,當(dāng)我們排除那些“死亡數(shù)據(jù)”之后,pH值低的病人他們的病情其實(shí)并不樂(lè)觀。
一些數(shù)據(jù)科學(xué)家在沒(méi)有理論或常識(shí)指導(dǎo)的情況下,單單從龐大的數(shù)據(jù)中企圖尋找某種模式。他們認(rèn)為思考一個(gè)問(wèn)題限制了新知識(shí)的發(fā)現(xiàn)。不幸的是,大數(shù)據(jù)時(shí)代使得各種模式成千上萬(wàn),然而其中大多數(shù)都是毫無(wú)意義的。這一悖論在于:為了得出某種模式越是瘋狂地去搜索數(shù)據(jù),得出的結(jié)論可能越?jīng)]有價(jià)值。
一家互聯(lián)網(wǎng)營(yíng)銷公司在100多個(gè)國(guó)家測(cè)試了其登陸頁(yè)面的三種顏色(黃色、紅色和藍(lán)綠色),并將其與傳統(tǒng)的藍(lán)色相對(duì)比。他們得出的結(jié)論是,英國(guó)人喜歡藍(lán)綠色,但事實(shí)并非如此。數(shù)學(xué)家熱愛(ài)數(shù)學(xué),非數(shù)學(xué)家“畏懼”數(shù)學(xué)。這一致命的組合,往往會(huì)導(dǎo)致建立很多極其不現(xiàn)實(shí)的模型。
許多抵押貸款違約的數(shù)學(xué)模型在大衰退期間崩潰了,因?yàn)樗麄兒?jiǎn)單的假設(shè),違約的概率呈現(xiàn)正態(tài)分布且是獨(dú)立存在的。他們低估了極端事件發(fā)生的可能性,也忽略了經(jīng)濟(jì)衰退等宏觀經(jīng)濟(jì)事件將引發(fā)的大量抵押貸款違約的可能性。由于計(jì)算機(jī)能夠非常高效的處理某些問(wèn)題,人們很容易認(rèn)為,計(jì)算機(jī)擁有高智能。但是應(yīng)對(duì)具體任務(wù)的高效性與應(yīng)對(duì)各類復(fù)雜情況的綜合智力,這兩者是十分不同的。我們對(duì)于計(jì)算機(jī)的“崇拜”其實(shí)是一種有害的癡迷。
現(xiàn)如今,算法犯罪學(xué)在審前保釋、審后判決和定罪后假釋等決定中使用黑箱模型變得司空見(jiàn)慣。然而,黑箱的算法往往帶有種族偏見(jiàn),甚至不如那些只考慮年齡和前科的簡(jiǎn)單模型。為了能夠找到數(shù)據(jù)之間的重要關(guān)系,研究者試圖以各種各樣的方式對(duì)數(shù)據(jù)進(jìn)行分析。羅納德科斯(Ronald Coase)曾精辟的對(duì)此表示,“如果你‘折磨’數(shù)據(jù)的時(shí)間夠久,它們總會(huì)‘招供’?!?/p>
物理學(xué)家理查德·費(fèi)曼(Richard Feynman)曾說(shuō)過(guò):首先你不能欺騙自己——而自己是最容易被欺騙的人。真正的科學(xué)家會(huì)分享他們的理論,質(zhì)疑他們的假設(shè),并尋找機(jī)會(huì)進(jìn)行實(shí)驗(yàn)來(lái)驗(yàn)證或否定其理論與假設(shè)。而“數(shù)據(jù)小丑”只會(huì)看到他們想看的東西。
當(dāng)數(shù)據(jù)波動(dòng)較大時(shí),大部分被測(cè)數(shù)據(jù)會(huì)高于現(xiàn)象,但隨后越來(lái)越多的值才更接近平均值。簡(jiǎn)單來(lái)說(shuō),就是某項(xiàng)指標(biāo)的表現(xiàn)過(guò)高或過(guò)低后會(huì)自然回歸到平均水平。一位高爾夫球手如果單憑僥幸在一次比賽中贏得了金牌,他很可能在下一次的比賽中表現(xiàn)欠佳,這并非是運(yùn)氣不好或者發(fā)揮失常,只是因?yàn)樯洗蔚膭倮鋵?shí)高估了他的實(shí)力。
對(duì)于公司也是如此。一名數(shù)據(jù)分析師曾對(duì)過(guò)去三個(gè)月“表現(xiàn)欠佳”的網(wǎng)頁(yè)布局進(jìn)行修改,希望能夠提高其收益。他顯然“大獲全勝”。在他對(duì)頁(yè)面布局做出調(diào)整之后的第二天,收益激增20%。之后收益增長(zhǎng)依舊持續(xù)了一小段時(shí)間。不過(guò),好景不長(zhǎng),事實(shí)證明這些確實(shí)是表現(xiàn)欠佳的網(wǎng)站,其收入已逐漸向平均水平回歸。
在大數(shù)據(jù)時(shí)代,企業(yè)和政府不斷地監(jiān)控我們,以便預(yù)測(cè)我們的行為并操縱我們的行為。優(yōu)秀的數(shù)據(jù)科學(xué)家懂得謹(jǐn)慎行事,尊重我們的權(quán)利和隱私?!凹核挥鹗┯谌恕边@句話對(duì)于數(shù)據(jù)科學(xué)同樣適用。所以,要想避免以上那些“錯(cuò)誤”或“陷阱”,我們需要有批判性的思維。要將科學(xué)應(yīng)用到數(shù)據(jù)科學(xué)之中,因此,我們更應(yīng)該像科學(xué)家那樣去思考,而不是像機(jī)器那樣。