電子科大把大數(shù)據(jù)運(yùn)用到社會(huì)科學(xué)的研究中
掃描二維碼
隨時(shí)隨地手機(jī)看文章
日前,電子科技大學(xué)大數(shù)據(jù)研究中心主任周濤教授、高見(jiàn)博士在《物理報(bào)道》發(fā)表長(zhǎng)篇綜述論文?!段锢韴?bào)道》是物理科學(xué)和交叉科學(xué)類最具國(guó)際影響力的期刊之一,是國(guó)際頂尖級(jí)期刊。這篇名為“計(jì)算社會(huì)經(jīng)濟(jì)學(xué)”的論文,主要是通過(guò)利用采集的大數(shù)據(jù),分析全球經(jīng)濟(jì)發(fā)展?fàn)顩r、區(qū)域經(jīng)濟(jì)水平、城市空間結(jié)構(gòu)布局和個(gè)體社會(huì)經(jīng)濟(jì)狀況等。相比過(guò)去而言,改變了傳統(tǒng)的“問(wèn)卷調(diào)查、普查”的方式,獲取的數(shù)據(jù)更具有真實(shí)性,對(duì)政府的決策更有指導(dǎo)意義。
大數(shù)據(jù)的運(yùn)用改變社會(huì)科學(xué)的調(diào)查方式
據(jù)周濤教授介紹,社會(huì)科學(xué)的研究非常復(fù)雜,其基本單元(人)要比物理學(xué)的基本單元(基本粒子)復(fù)雜得多。社會(huì)科學(xué)的研究對(duì)象具有極大的不完備性和不確定性,如政策和法律條文,不僅復(fù)雜,而且不容易用數(shù)值手段來(lái)刻畫(huà)。同時(shí),影響社會(huì)發(fā)展的因素?cái)?shù)不勝數(shù),任何包羅萬(wàn)象的理論都不可能將它們?nèi)P(pán)納入,而單個(gè)因素也是不獨(dú)立不穩(wěn)定的,受到外部環(huán)境和其他因素的影響很多。因此,搜集大量的數(shù)據(jù),覆蓋足夠的面,可以讓社會(huì)科學(xué)調(diào)查得到的結(jié)果更加真實(shí),為政府決策提供更加科學(xué)合理的建議。
但是,此前很多社會(huì)學(xué)的研究,依賴于問(wèn)卷調(diào)查、普查等方式,這些數(shù)據(jù)采集的規(guī)模相對(duì)較小,不具有廣泛的代表意義;此外,還存在獲取數(shù)據(jù)的成本較高、時(shí)間滯后等劣勢(shì)。而此次在論文中所推薦的調(diào)查方式,則是基于新興的大數(shù)據(jù)技術(shù)。
高見(jiàn)博士提到,隨著大數(shù)據(jù)和人工智能技術(shù)的發(fā)展,為社會(huì)經(jīng)濟(jì)帶來(lái)了前所未有的機(jī)遇和改變。一方面,我們可以用相對(duì)較低的成本獲取衛(wèi)星遙感、手機(jī)通訊、社交媒體等大規(guī)模社會(huì)經(jīng)濟(jì)數(shù)據(jù),其具有實(shí)時(shí)性強(qiáng)和高時(shí)空分辨率等優(yōu)勢(shì)。另一方面,機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、網(wǎng)絡(luò)分析等計(jì)算方法的發(fā)展,有效提升了定量感知和預(yù)測(cè)社會(huì)經(jīng)濟(jì)態(tài)勢(shì)的能力。
新興交叉學(xué)科計(jì)算社會(huì)經(jīng)濟(jì)學(xué)應(yīng)運(yùn)而生
這篇綜述文章可以看作一個(gè)新興的交叉學(xué)科——計(jì)算社會(huì)經(jīng)濟(jì)學(xué),它基于大規(guī)模的真實(shí)數(shù)據(jù),用定量化的手段研究社會(huì)經(jīng)濟(jì)發(fā)展中的各種現(xiàn)象,特別是與社會(huì)過(guò)程有關(guān)的經(jīng)濟(jì)發(fā)展問(wèn)題,以及與經(jīng)濟(jì)發(fā)展有關(guān)的社會(huì)問(wèn)題。它既可以被看作是社會(huì)經(jīng)濟(jì)學(xué)因?yàn)榉椒ㄕ摰淖兏锼纬傻男路种В部梢员豢醋魇怯?jì)算社會(huì)科學(xué)因?yàn)檠芯繉?duì)象的聚焦所形成的新分支。計(jì)算社會(huì)經(jīng)濟(jì)學(xué)特別強(qiáng)調(diào)三個(gè)關(guān)鍵詞:“定量化”,強(qiáng)調(diào)用數(shù)值而非描述來(lái)刻畫(huà)問(wèn)題和呈現(xiàn)結(jié)果;“真實(shí)數(shù)據(jù)”,強(qiáng)調(diào)理論模型必須要服從真實(shí)數(shù)據(jù),以對(duì)真實(shí)數(shù)據(jù)的解釋和預(yù)測(cè)能力為評(píng)價(jià)準(zhǔn)繩;“大規(guī)模”,強(qiáng)調(diào)盡可能獲取能夠直接反映全體的數(shù)據(jù)樣本,即全體尺度數(shù)據(jù)。文章通過(guò)介紹大量的研究實(shí)例,描摹了社會(huì)經(jīng)濟(jì)學(xué)發(fā)展在方法論上正在產(chǎn)生的兩大改變。一是為了分析遙感圖像、街景照片、社交網(wǎng)絡(luò)、文本內(nèi)容這些新型數(shù)據(jù),傳統(tǒng)的統(tǒng)計(jì)分析工具無(wú)法滿足需求,必須高度依賴于人工智能,特別是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的先進(jìn)技術(shù),例如深度學(xué)習(xí)算法。二是我們可以通過(guò)建立利用全體尺度的數(shù)據(jù)預(yù)測(cè)少量高價(jià)值數(shù)據(jù)的模型,從而可以推斷出全體尺度上的高價(jià)值信息。
例如,科學(xué)家對(duì)盧旺達(dá)856名手機(jī)用戶的家庭經(jīng)濟(jì)情況進(jìn)行了詳細(xì)的調(diào)查,然后通過(guò)機(jī)器學(xué)習(xí)方法,建立了利用手機(jī)數(shù)據(jù)預(yù)測(cè)家庭經(jīng)濟(jì)情況的模型,從而以很高的精度直接從手機(jī)數(shù)據(jù)中推測(cè)盧旺達(dá)150多萬(wàn)家庭的經(jīng)濟(jì)情況。這種結(jié)合全體尺度易獲得數(shù)據(jù),少量難以獲得的高價(jià)值數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,去推斷全體尺度難以獲得的高價(jià)值數(shù)據(jù),是計(jì)算社會(huì)經(jīng)濟(jì)學(xué)研究中很有代表性的一種新方法,體現(xiàn)了社會(huì)科學(xué)和計(jì)算機(jī)科學(xué)理念和方法的深度融合??傮w而言,社會(huì)經(jīng)濟(jì)學(xué)將會(huì)和數(shù)據(jù)科學(xué)、人工智能結(jié)成方法論上的深度聯(lián)盟。周濤表示,長(zhǎng)遠(yuǎn)來(lái)看,這種由大數(shù)據(jù)和人工智能發(fā)展所驅(qū)動(dòng)的新理念和新方法論,毫無(wú)疑問(wèn)會(huì)成為未來(lái)社會(huì)科學(xué)主流的方法論,并且將不可逆轉(zhuǎn)而深刻地改變整個(gè)社會(huì)科學(xué)!