1967-2015:數(shù)據(jù)新聞這50年!
數(shù)據(jù)新聞的發(fā)端
數(shù)據(jù)新聞的發(fā)端可以追溯到對美國大選結(jié)果的預(yù)測。而大約60年后,電腦輔助的報道工具在全球范圍內(nèi)成為調(diào)查性報道的核心手段。
許多實(shí)踐者將計算機(jī)輔助報道和數(shù)據(jù)新聞的發(fā)端回溯到了1952年。當(dāng)時美國的哥倫比亞廣播公司(CBS)試圖讓專家在大型計算機(jī)的幫助下預(yù)測總統(tǒng)選舉的結(jié)果。這看起來與當(dāng)下的數(shù)據(jù)新聞相去甚遠(yuǎn),因?yàn)楫?dāng)時他們根本沒有使用數(shù)據(jù)。直到1967年,數(shù)據(jù)分析才開始流行起來。
那一年夏天底特律發(fā)生了嚴(yán)重的黑人騷亂,為了了解并解釋底特律騷亂,《底特律自由報》的Philip Meye運(yùn)用了計算機(jī)對一份針對底特律居民的調(diào)查進(jìn)行了分析。(幾十年后《衛(wèi)報》在英國使用了一些相同的方法來研究種族騷亂的事件并引用了邁耶的作品。)
在70年代,Philip Meye繼續(xù)與地方報紙《費(fèi)城問詢報》(Philadelphia Inquire)的Donald Barlett和James Steele合作分析了當(dāng)?shù)厮痉ㄏ到y(tǒng)的量刑模式,與Rich Morin在《邁阿密先驅(qū)報》(Miami Herald)分析了資產(chǎn)評估記錄。Philip Meye還出版了一本書叫做《精確新聞》(Precision Journalism),解釋并進(jìn)一步提倡使用數(shù)據(jù)庫分析和社會調(diào)查的辦法來報道新聞,自此這本書一版再版。
然而,在80年代中期以前依然只有寥寥可數(shù)的幾位記者采用了這些技術(shù)手段。那時的一個標(biāo)志性事件是Elliot Jaspin在新聞中使用數(shù)據(jù)庫進(jìn)行分析而在《普羅維登斯雜志公報》備受賞識,他的代表作包括了對危險校車司機(jī)的分析和對與住房貸款有關(guān)的政治丑聞的調(diào)查。同時另外有50名左右的記者在80年代末經(jīng)常與Philip Meye,Jaspin或者史蒂夫·多依格的《邁阿密先驅(qū)報》進(jìn)行交流,開始在他們的新聞中報道進(jìn)行數(shù)據(jù)分析。
這時,輔助記者們進(jìn)行報道的是更加先進(jìn)的個人電腦以及一個由Jaspin和新聞程序師Daniel Woods寫的程序——Nine Track Express,這個程序使得電腦與磁盤間的信息傳輸更加便捷。這樣的條件使得當(dāng)時的記者得以繞過官僚機(jī)構(gòu)和只能在大學(xué)或報社使用大型計算機(jī)造成的延期。
1989年,美國新聞業(yè)界終于承認(rèn)了計算機(jī)輔助新聞報道的價值,并為《亞特蘭大憲法報》(The Atlanta Journal-Constitution)調(diào)查住房貸款中種族差異的報道頒發(fā)了普利策新聞獎。同一年,Jaspin在密蘇里新聞學(xué)院建立了如今廣為人知的美國計算機(jī)輔助報道協(xié)會(The National Institute for Computer-Assisted Reporting -NICAR)的前身。之后1990年,印第安納州大學(xué)教授詹姆斯·布朗(James Brown)在印第安納州首府印第安納波利斯主持舉辦了第一屆計算機(jī)輔助新聞峰會。我出版書籍《計算機(jī)輔助新聞報道實(shí)踐指南》的稿費(fèi)也資助了這次峰會的舉辦。這本書是第一本探究計算機(jī)輔助新聞報道的書籍而現(xiàn)在它已經(jīng)發(fā)行到第四版了。
在90年代至21世紀(jì)早期,計算機(jī)輔助新聞報道的使用得到了巨大發(fā)展,主要原因在于美國調(diào)查編輯協(xié)會(Investigative Reporters and Editors-IRE)和美國計算機(jī)輔助報道協(xié)會在密蘇里州乃至全世界各地不斷舉辦研討會。這一系列的研討會已經(jīng)是IRE和密蘇里新聞學(xué)院的聯(lián)合項(xiàng)目。
IRE官網(wǎng)
21世紀(jì)的早些年份,人們見證了全球深度報道網(wǎng)開始發(fā)揮著重要的作用,并于2001年在哥本哈根舉辦了第一屆峰會,這屆峰會提供了強(qiáng)大的計算機(jī)輔助新聞報道的路徑和親手實(shí)踐的訓(xùn)練機(jī)會。
NICAR時代
1994年,NICAR(全國計算機(jī)輔助報道協(xié)會)正式創(chuàng)辦。培訓(xùn)主管詹妮弗·拉斐爾(Jennifer LaFleur)和我雄心勃勃地發(fā)起了這個不斷壯大的項(xiàng)目,最終這個項(xiàng)目容納了每年50場峰會的規(guī)模。到了1996年,美國的風(fēng)向成功地拓展到了其他國家,一些國外的記者終于開始在NICAR上成為數(shù)據(jù)新聞的“新兵”。此外,IRE連同麥考密克基金會在墨西哥城設(shè)立了一個在拉丁美洲監(jiān)督數(shù)據(jù)訓(xùn)練的項(xiàng)目。
在90年代,美國之外的記者開始疑慮自己是否能夠在自己的國家獲得數(shù)據(jù)。這個訓(xùn)練項(xiàng)目為他們展現(xiàn)了怎樣將國際或者美國的數(shù)據(jù)運(yùn)用到他們的報道中,如何構(gòu)建起他們自己的數(shù)據(jù)庫以及如何在自己的國家中找到數(shù)據(jù)。
通過這個項(xiàng)目的努力,1999年時芬蘭、瑞士、新西蘭、委內(nèi)瑞拉、阿根廷、荷蘭、挪威、巴西、墨西哥、俄羅斯、波斯尼亞和加拿大各國的記者都開始在他們的新聞報道中融入數(shù)據(jù)分析。
同時,1997年時在倫敦,新聞學(xué)教授Milverton Wallace開始舉行“NetMedia”年度峰會,在互聯(lián)網(wǎng)上提供會話和由NICAR和丹麥記者們授課的計算機(jī)輔助新聞報道的相關(guān)課程。課程函蓋了互聯(lián)網(wǎng)的基礎(chǔ)使用、電子表格和數(shù)據(jù)庫管理。許多英國以及歐洲其他國家的記者甚至非洲記者都踴躍地參與了這些課程。
在丹麥曾于1996年在密蘇里州參與過訓(xùn)練營的記者Nils Mulvad和Flemming Svith在NICAR的協(xié)助下在本國舉行了1997和1998年的年度峰會。他們同時出版了一本《丹麥計算機(jī)輔助報道手冊》,1998年還創(chuàng)建了丹麥國際分析性報道中心(DICAR)。2001年時他們還同IRE 一同組織籌備了第一屆全球調(diào)查性新聞峰會,同時該峰會也成為了瑞典、挪威、芬蘭和荷蘭的重要會議之一。
Nils Mulvad
通過全球調(diào)查峰會,使用數(shù)據(jù)的報道手段也很快地傳遞到東歐。在東歐,曾構(gòu)建了有計劃性的犯罪與腐敗報道項(xiàng)目的Drew Sullivan以及羅馬尼亞記者Paul Radu成為了強(qiáng)有力的支持者和組織者。
研討會也通過密蘇里大學(xué)傳遞到了中國,透過世界報業(yè)協(xié)會擴(kuò)散到了印度。同期,Steve Doig,計算機(jī)輔助新聞報道的先驅(qū)同時也是現(xiàn)在亞利桑那州立大學(xué)計算機(jī)輔助報道系的騎士會會長,在全球范圍內(nèi)游歷講授計算機(jī)輔助報道。同他一樣的NICAR的培訓(xùn)導(dǎo)師還有Jo Craven McGinty, Tom McGinty, Ron Nixon, Andy Lehren 和Sarah Cohen,他們?nèi)缃穸际恰都~約時報》或《媒體》的記者。
Steve Doig
數(shù)據(jù)可視化不斷發(fā)展
2005年,新聞報道中的數(shù)據(jù)可視化的應(yīng)用得到了空前的發(fā)展。當(dāng)時美國的一位程序員Adrian Holovaty創(chuàng)建了一個關(guān)于芝加哥犯罪的谷歌聚合內(nèi)容。這個項(xiàng)目刺激了更多的程序員針對新聞報道進(jìn)行開發(fā)。Holovaty在2007年創(chuàng)建了Every Block,運(yùn)用了更多本地數(shù)據(jù)融入到在線地圖之中,但是這個項(xiàng)目后來因沒有對政府?dāng)?shù)據(jù)的準(zhǔn)確性進(jìn)行更徹底的分析而遭到批評。
Adrian Holovaty
同一年,美國的開放數(shù)據(jù)運(yùn)動正式開始,全球許多地區(qū)也開始進(jìn)行了類似的努力。這樣的舉措增加了全球范圍內(nèi)政府?dāng)?shù)據(jù)的可訪問性,雖然這樣的需求依然需要通過獲得信息法所保障的自由來獲取政府并未公布的數(shù)據(jù)。
到了2009年,越來越多的計算機(jī)程序要同新聞業(yè)內(nèi)的程序員組建了hacks/hackers,促進(jìn)了兩個不同職業(yè)的人群共享彼此的信息并緩解了兩個群體之間的文化沖突。
Aron Pilhofer,《紐約時報》、《衛(wèi)報》和西北大學(xué)新聞學(xué)院的Rich Gordon,都紛紛開始推動創(chuàng)建一個人際圈——這群人“對Web或數(shù)字應(yīng)用發(fā)展、支持新聞業(yè)任務(wù)和目的科技創(chuàng)新感興趣”。同時在硅谷,Burt Herman讓記者和科技人員坐在了一起。三方開始創(chuàng)建Hacks/Hackers,最終達(dá)成的結(jié)果是一個技術(shù)日益成熟的新聞編輯室,增加了從網(wǎng)站獲取數(shù)據(jù)的能力,并使得數(shù)據(jù)更易于管理、可視化和可交互。
另外一個新聞與編程的復(fù)合型產(chǎn)物則是對數(shù)據(jù)的固有缺陷以及確保數(shù)據(jù)完整性的重新認(rèn)知。
正如Marcos Vanetta,在《德州論壇報》的Mozilla OpenNews研究員所說:“錯誤是不可發(fā)生的……在軟件開發(fā)中我們常??梢苑稿e然后糾正它們,甚至最壞的情況下我們還有備份。但是在新聞中,你不能犯錯,你還有聲譽(yù)需要維系。編輯團(tuán)隊并不能夠像開發(fā)人員那樣習(xí)慣失誤。”
近年的突破
2009、2010和2011年同樣也是數(shù)據(jù)新聞的突破之年。2009年在加拿大Fred Vallance-Jones 和David McKie出版了一本《計算機(jī)輔助報道之全面入門》,其中特別強(qiáng)調(diào)了加拿大的計算機(jī)輔助報道案例。歐洲的新聞中心開建了數(shù)據(jù)新聞中心,在全歐范圍內(nèi)組織相關(guān)的工作團(tuán)隊,記者Paul Bradshaw成為英國數(shù)據(jù)新聞公認(rèn)的先驅(qū)。維基解密發(fā)布了阿富汗戰(zhàn)爭筆記及秘密文件還有伊拉克戰(zhàn)爭筆記,正待全世界的記者來處理這些大量的文本數(shù)據(jù)。
緊接著2011年,《衛(wèi)報》刊登的關(guān)于城市種族騷亂的系列報道令人印象深刻,同時Journalismfund.eu統(tǒng)籌了第一屆“數(shù)據(jù)收獲季”會議(Data Harvest conference)。
英國的新聞?wù){(diào)查中心(由Gavin MacFadyen主導(dǎo))在早期曾參與提供了IRE關(guān)于數(shù)據(jù)新聞的暑期學(xué)校課程,而在這個階段,它在計算機(jī)輔助報道領(lǐng)域老將David Donald的協(xié)助下繼續(xù)運(yùn)行著自己的強(qiáng)有力的項(xiàng)目。
同時在南非的智慧大學(xué)(Wits University),Anton Harber 和Margaret Renn大大增加了年度電力會議上的數(shù)據(jù)會話,同時數(shù)據(jù)分析已經(jīng)在亞洲和澳大利亞展開。
到了2015年,經(jīng)過記者使用數(shù)據(jù)報道新聞快50年的歷程,顯而易見的是數(shù)據(jù)不僅成為了日常新聞的一部分,同時也成為新聞報道的一大驅(qū)動力。數(shù)據(jù)作為報道工具和報道手段的情境還在不斷地拓展。
應(yīng)用電腦工具到新聞報道中發(fā)端于社會學(xué)研究手段和應(yīng)用數(shù)據(jù)統(tǒng)計方法來探究社會問題。但是經(jīng)過這些年,數(shù)據(jù)計算已經(jīng)廣泛地拓展到探究典型案例和意外事件,記者們使用電子表格和數(shù)據(jù)管理工具對直觀上并不明顯相關(guān)的數(shù)據(jù)集進(jìn)行相關(guān)性分析,使用繪制工具將數(shù)據(jù)映射到地理環(huán)境和社交網(wǎng)絡(luò)中,實(shí)施網(wǎng)絡(luò)抓取,甚至開始清洗數(shù)據(jù),將數(shù)據(jù)應(yīng)用到眾籌,應(yīng)用到與受眾的交互中,應(yīng)用到多媒體環(huán)境乃至應(yīng)用到文本挖掘。
關(guān)于將數(shù)據(jù)應(yīng)用到高質(zhì)量新聞和各種品牌活動這樣的行為應(yīng)該怎么定義,依然有許多值得討論之處。但是,無論我們稱其為“精確新聞”、“計算機(jī)輔助報道”、“數(shù)據(jù)新聞”、“數(shù)據(jù)驅(qū)動新聞”或是“計算新聞”,好消息是,它將作為新聞的一部分而存在下去。