1967-2015:數(shù)據(jù)新聞這50年!
數(shù)據(jù)新聞的發(fā)端
數(shù)據(jù)新聞的發(fā)端可以追溯到對(duì)美國(guó)大選結(jié)果的預(yù)測(cè)。而大約60年后,電腦輔助的報(bào)道工具在全球范圍內(nèi)成為調(diào)查性報(bào)道的核心手段。
許多實(shí)踐者將計(jì)算機(jī)輔助報(bào)道和數(shù)據(jù)新聞的發(fā)端回溯到了1952年。當(dāng)時(shí)美國(guó)的哥倫比亞廣播公司(CBS)試圖讓專家在大型計(jì)算機(jī)的幫助下預(yù)測(cè)總統(tǒng)選舉的結(jié)果。這看起來(lái)與當(dāng)下的數(shù)據(jù)新聞相去甚遠(yuǎn),因?yàn)楫?dāng)時(shí)他們根本沒(méi)有使用數(shù)據(jù)。直到1967年,數(shù)據(jù)分析才開(kāi)始流行起來(lái)。
那一年夏天底特律發(fā)生了嚴(yán)重的黑人騷亂,為了了解并解釋底特律騷亂,《底特律自由報(bào)》的Philip Meye運(yùn)用了計(jì)算機(jī)對(duì)一份針對(duì)底特律居民的調(diào)查進(jìn)行了分析。(幾十年后《衛(wèi)報(bào)》在英國(guó)使用了一些相同的方法來(lái)研究種族騷亂的事件并引用了邁耶的作品。)
在70年代,Philip Meye繼續(xù)與地方報(bào)紙《費(fèi)城問(wèn)詢報(bào)》(Philadelphia Inquire)的Donald Barlett和James Steele合作分析了當(dāng)?shù)厮痉ㄏ到y(tǒng)的量刑模式,與Rich Morin在《邁阿密先驅(qū)報(bào)》(Miami Herald)分析了資產(chǎn)評(píng)估記錄。Philip Meye還出版了一本書叫做《精確新聞》(Precision Journalism),解釋并進(jìn)一步提倡使用數(shù)據(jù)庫(kù)分析和社會(huì)調(diào)查的辦法來(lái)報(bào)道新聞,自此這本書一版再版。
然而,在80年代中期以前依然只有寥寥可數(shù)的幾位記者采用了這些技術(shù)手段。那時(shí)的一個(gè)標(biāo)志性事件是Elliot Jaspin在新聞中使用數(shù)據(jù)庫(kù)進(jìn)行分析而在《普羅維登斯雜志公報(bào)》備受賞識(shí),他的代表作包括了對(duì)危險(xiǎn)校車司機(jī)的分析和對(duì)與住房貸款有關(guān)的政治丑聞的調(diào)查。同時(shí)另外有50名左右的記者在80年代末經(jīng)常與Philip Meye,Jaspin或者史蒂夫·多依格的《邁阿密先驅(qū)報(bào)》進(jìn)行交流,開(kāi)始在他們的新聞中報(bào)道進(jìn)行數(shù)據(jù)分析。
這時(shí),輔助記者們進(jìn)行報(bào)道的是更加先進(jìn)的個(gè)人電腦以及一個(gè)由Jaspin和新聞程序師Daniel Woods寫的程序——Nine Track Express,這個(gè)程序使得電腦與磁盤間的信息傳輸更加便捷。這樣的條件使得當(dāng)時(shí)的記者得以繞過(guò)官僚機(jī)構(gòu)和只能在大學(xué)或報(bào)社使用大型計(jì)算機(jī)造成的延期。
1989年,美國(guó)新聞業(yè)界終于承認(rèn)了計(jì)算機(jī)輔助新聞報(bào)道的價(jià)值,并為《亞特蘭大憲法報(bào)》(The Atlanta Journal-Constitution)調(diào)查住房貸款中種族差異的報(bào)道頒發(fā)了普利策新聞獎(jiǎng)。同一年,Jaspin在密蘇里新聞學(xué)院建立了如今廣為人知的美國(guó)計(jì)算機(jī)輔助報(bào)道協(xié)會(huì)(The National Institute for Computer-Assisted Reporting -NICAR)的前身。之后1990年,印第安納州大學(xué)教授詹姆斯·布朗(James Brown)在印第安納州首府印第安納波利斯主持舉辦了第一屆計(jì)算機(jī)輔助新聞峰會(huì)。我出版書籍《計(jì)算機(jī)輔助新聞報(bào)道實(shí)踐指南》的稿費(fèi)也資助了這次峰會(huì)的舉辦。這本書是第一本探究計(jì)算機(jī)輔助新聞報(bào)道的書籍而現(xiàn)在它已經(jīng)發(fā)行到第四版了。
在90年代至21世紀(jì)早期,計(jì)算機(jī)輔助新聞報(bào)道的使用得到了巨大發(fā)展,主要原因在于美國(guó)調(diào)查編輯協(xié)會(huì)(Investigative Reporters and Editors-IRE)和美國(guó)計(jì)算機(jī)輔助報(bào)道協(xié)會(huì)在密蘇里州乃至全世界各地不斷舉辦研討會(huì)。這一系列的研討會(huì)已經(jīng)是IRE和密蘇里新聞學(xué)院的聯(lián)合項(xiàng)目。
IRE官網(wǎng)
21世紀(jì)的早些年份,人們見(jiàn)證了全球深度報(bào)道網(wǎng)開(kāi)始發(fā)揮著重要的作用,并于2001年在哥本哈根舉辦了第一屆峰會(huì),這屆峰會(huì)提供了強(qiáng)大的計(jì)算機(jī)輔助新聞報(bào)道的路徑和親手實(shí)踐的訓(xùn)練機(jī)會(huì)。
NICAR時(shí)代
1994年,NICAR(全國(guó)計(jì)算機(jī)輔助報(bào)道協(xié)會(huì))正式創(chuàng)辦。培訓(xùn)主管詹妮弗·拉斐爾(Jennifer LaFleur)和我雄心勃勃地發(fā)起了這個(gè)不斷壯大的項(xiàng)目,最終這個(gè)項(xiàng)目容納了每年50場(chǎng)峰會(huì)的規(guī)模。到了1996年,美國(guó)的風(fēng)向成功地拓展到了其他國(guó)家,一些國(guó)外的記者終于開(kāi)始在NICAR上成為數(shù)據(jù)新聞的“新兵”。此外,IRE連同麥考密克基金會(huì)在墨西哥城設(shè)立了一個(gè)在拉丁美洲監(jiān)督數(shù)據(jù)訓(xùn)練的項(xiàng)目。
在90年代,美國(guó)之外的記者開(kāi)始疑慮自己是否能夠在自己的國(guó)家獲得數(shù)據(jù)。這個(gè)訓(xùn)練項(xiàng)目為他們展現(xiàn)了怎樣將國(guó)際或者美國(guó)的數(shù)據(jù)運(yùn)用到他們的報(bào)道中,如何構(gòu)建起他們自己的數(shù)據(jù)庫(kù)以及如何在自己的國(guó)家中找到數(shù)據(jù)。
通過(guò)這個(gè)項(xiàng)目的努力,1999年時(shí)芬蘭、瑞士、新西蘭、委內(nèi)瑞拉、阿根廷、荷蘭、挪威、巴西、墨西哥、俄羅斯、波斯尼亞和加拿大各國(guó)的記者都開(kāi)始在他們的新聞報(bào)道中融入數(shù)據(jù)分析。
同時(shí),1997年時(shí)在倫敦,新聞學(xué)教授Milverton Wallace開(kāi)始舉行“NetMedia”年度峰會(huì),在互聯(lián)網(wǎng)上提供會(huì)話和由NICAR和丹麥記者們授課的計(jì)算機(jī)輔助新聞報(bào)道的相關(guān)課程。課程函蓋了互聯(lián)網(wǎng)的基礎(chǔ)使用、電子表格和數(shù)據(jù)庫(kù)管理。許多英國(guó)以及歐洲其他國(guó)家的記者甚至非洲記者都踴躍地參與了這些課程。
在丹麥曾于1996年在密蘇里州參與過(guò)訓(xùn)練營(yíng)的記者Nils Mulvad和Flemming Svith在NICAR的協(xié)助下在本國(guó)舉行了1997和1998年的年度峰會(huì)。他們同時(shí)出版了一本《丹麥計(jì)算機(jī)輔助報(bào)道手冊(cè)》,1998年還創(chuàng)建了丹麥國(guó)際分析性報(bào)道中心(DICAR)。2001年時(shí)他們還同IRE 一同組織籌備了第一屆全球調(diào)查性新聞峰會(huì),同時(shí)該峰會(huì)也成為了瑞典、挪威、芬蘭和荷蘭的重要會(huì)議之一。
Nils Mulvad
通過(guò)全球調(diào)查峰會(huì),使用數(shù)據(jù)的報(bào)道手段也很快地傳遞到東歐。在東歐,曾構(gòu)建了有計(jì)劃性的犯罪與腐敗報(bào)道項(xiàng)目的Drew Sullivan以及羅馬尼亞記者Paul Radu成為了強(qiáng)有力的支持者和組織者。
研討會(huì)也通過(guò)密蘇里大學(xué)傳遞到了中國(guó),透過(guò)世界報(bào)業(yè)協(xié)會(huì)擴(kuò)散到了印度。同期,Steve Doig,計(jì)算機(jī)輔助新聞報(bào)道的先驅(qū)同時(shí)也是現(xiàn)在亞利桑那州立大學(xué)計(jì)算機(jī)輔助報(bào)道系的騎士會(huì)會(huì)長(zhǎng),在全球范圍內(nèi)游歷講授計(jì)算機(jī)輔助報(bào)道。同他一樣的NICAR的培訓(xùn)導(dǎo)師還有Jo Craven McGinty, Tom McGinty, Ron Nixon, Andy Lehren 和Sarah Cohen,他們?nèi)缃穸际恰都~約時(shí)報(bào)》或《媒體》的記者。
Steve Doig
數(shù)據(jù)可視化不斷發(fā)展
2005年,新聞報(bào)道中的數(shù)據(jù)可視化的應(yīng)用得到了空前的發(fā)展。當(dāng)時(shí)美國(guó)的一位程序員Adrian Holovaty創(chuàng)建了一個(gè)關(guān)于芝加哥犯罪的谷歌聚合內(nèi)容。這個(gè)項(xiàng)目刺激了更多的程序員針對(duì)新聞報(bào)道進(jìn)行開(kāi)發(fā)。Holovaty在2007年創(chuàng)建了Every Block,運(yùn)用了更多本地?cái)?shù)據(jù)融入到在線地圖之中,但是這個(gè)項(xiàng)目后來(lái)因沒(méi)有對(duì)政府?dāng)?shù)據(jù)的準(zhǔn)確性進(jìn)行更徹底的分析而遭到批評(píng)。
Adrian Holovaty
同一年,美國(guó)的開(kāi)放數(shù)據(jù)運(yùn)動(dòng)正式開(kāi)始,全球許多地區(qū)也開(kāi)始進(jìn)行了類似的努力。這樣的舉措增加了全球范圍內(nèi)政府?dāng)?shù)據(jù)的可訪問(wèn)性,雖然這樣的需求依然需要通過(guò)獲得信息法所保障的自由來(lái)獲取政府并未公布的數(shù)據(jù)。
到了2009年,越來(lái)越多的計(jì)算機(jī)程序要同新聞業(yè)內(nèi)的程序員組建了hacks/hackers,促進(jìn)了兩個(gè)不同職業(yè)的人群共享彼此的信息并緩解了兩個(gè)群體之間的文化沖突。
Aron Pilhofer,《紐約時(shí)報(bào)》、《衛(wèi)報(bào)》和西北大學(xué)新聞學(xué)院的Rich Gordon,都紛紛開(kāi)始推動(dòng)創(chuàng)建一個(gè)人際圈——這群人“對(duì)Web或數(shù)字應(yīng)用發(fā)展、支持新聞業(yè)任務(wù)和目的科技創(chuàng)新感興趣”。同時(shí)在硅谷,Burt Herman讓記者和科技人員坐在了一起。三方開(kāi)始創(chuàng)建Hacks/Hackers,最終達(dá)成的結(jié)果是一個(gè)技術(shù)日益成熟的新聞編輯室,增加了從網(wǎng)站獲取數(shù)據(jù)的能力,并使得數(shù)據(jù)更易于管理、可視化和可交互。
另外一個(gè)新聞與編程的復(fù)合型產(chǎn)物則是對(duì)數(shù)據(jù)的固有缺陷以及確保數(shù)據(jù)完整性的重新認(rèn)知。
正如Marcos Vanetta,在《德州論壇報(bào)》的Mozilla OpenNews研究員所說(shuō):“錯(cuò)誤是不可發(fā)生的……在軟件開(kāi)發(fā)中我們常??梢苑稿e(cuò)然后糾正它們,甚至最壞的情況下我們還有備份。但是在新聞中,你不能犯錯(cuò),你還有聲譽(yù)需要維系。編輯團(tuán)隊(duì)并不能夠像開(kāi)發(fā)人員那樣習(xí)慣失誤。”
近年的突破
2009、2010和2011年同樣也是數(shù)據(jù)新聞的突破之年。2009年在加拿大Fred Vallance-Jones 和David McKie出版了一本《計(jì)算機(jī)輔助報(bào)道之全面入門》,其中特別強(qiáng)調(diào)了加拿大的計(jì)算機(jī)輔助報(bào)道案例。歐洲的新聞中心開(kāi)建了數(shù)據(jù)新聞中心,在全歐范圍內(nèi)組織相關(guān)的工作團(tuán)隊(duì),記者Paul Bradshaw成為英國(guó)數(shù)據(jù)新聞公認(rèn)的先驅(qū)。維基解密發(fā)布了阿富汗戰(zhàn)爭(zhēng)筆記及秘密文件還有伊拉克戰(zhàn)爭(zhēng)筆記,正待全世界的記者來(lái)處理這些大量的文本數(shù)據(jù)。
緊接著2011年,《衛(wèi)報(bào)》刊登的關(guān)于城市種族騷亂的系列報(bào)道令人印象深刻,同時(shí)Journalismfund.eu統(tǒng)籌了第一屆“數(shù)據(jù)收獲季”會(huì)議(Data Harvest conference)。
英國(guó)的新聞?wù){(diào)查中心(由Gavin MacFadyen主導(dǎo))在早期曾參與提供了IRE關(guān)于數(shù)據(jù)新聞的暑期學(xué)校課程,而在這個(gè)階段,它在計(jì)算機(jī)輔助報(bào)道領(lǐng)域老將David Donald的協(xié)助下繼續(xù)運(yùn)行著自己的強(qiáng)有力的項(xiàng)目。
同時(shí)在南非的智慧大學(xué)(Wits University),Anton Harber 和Margaret Renn大大增加了年度電力會(huì)議上的數(shù)據(jù)會(huì)話,同時(shí)數(shù)據(jù)分析已經(jīng)在亞洲和澳大利亞展開(kāi)。
到了2015年,經(jīng)過(guò)記者使用數(shù)據(jù)報(bào)道新聞快50年的歷程,顯而易見(jiàn)的是數(shù)據(jù)不僅成為了日常新聞的一部分,同時(shí)也成為新聞報(bào)道的一大驅(qū)動(dòng)力。數(shù)據(jù)作為報(bào)道工具和報(bào)道手段的情境還在不斷地拓展。
應(yīng)用電腦工具到新聞報(bào)道中發(fā)端于社會(huì)學(xué)研究手段和應(yīng)用數(shù)據(jù)統(tǒng)計(jì)方法來(lái)探究社會(huì)問(wèn)題。但是經(jīng)過(guò)這些年,數(shù)據(jù)計(jì)算已經(jīng)廣泛地拓展到探究典型案例和意外事件,記者們使用電子表格和數(shù)據(jù)管理工具對(duì)直觀上并不明顯相關(guān)的數(shù)據(jù)集進(jìn)行相關(guān)性分析,使用繪制工具將數(shù)據(jù)映射到地理環(huán)境和社交網(wǎng)絡(luò)中,實(shí)施網(wǎng)絡(luò)抓取,甚至開(kāi)始清洗數(shù)據(jù),將數(shù)據(jù)應(yīng)用到眾籌,應(yīng)用到與受眾的交互中,應(yīng)用到多媒體環(huán)境乃至應(yīng)用到文本挖掘。
關(guān)于將數(shù)據(jù)應(yīng)用到高質(zhì)量新聞和各種品牌活動(dòng)這樣的行為應(yīng)該怎么定義,依然有許多值得討論之處。但是,無(wú)論我們稱其為“精確新聞”、“計(jì)算機(jī)輔助報(bào)道”、“數(shù)據(jù)新聞”、“數(shù)據(jù)驅(qū)動(dòng)新聞”或是“計(jì)算新聞”,好消息是,它將作為新聞的一部分而存在下去。