研究表明:個人隱私在網(wǎng)絡(luò)中不能得以有效保護(hù)
近日據(jù)外媒報道,英國帝國理工學(xué)院研究團(tuán)隊發(fā)表在《自然·通訊》雜志上的一項研究表明,目前網(wǎng)絡(luò)采用的匿名化和數(shù)據(jù)共享方法,有可能不足以保護(hù)個人隱私或滿足數(shù)據(jù)保護(hù)法律法規(guī)的要求。
隨著科學(xué)技術(shù)的不斷進(jìn)步,數(shù)據(jù)科學(xué)和人工智能正在不斷改變我們的日常生活。而人工智能比人類想象得更強(qiáng)大,也許寥寥幾個數(shù)據(jù)就能識別出數(shù)據(jù)的主人。這讓我們不禁擔(dān)憂,隨著大數(shù)據(jù)庫的智能化,個人的隱私在網(wǎng)絡(luò)上是否還安全。
并且隨著利用匿名數(shù)據(jù)集,包括瀏覽歷史記錄、手機(jī)和信用卡數(shù)據(jù),成功重新識別出個體身份的情況時有發(fā)生,甚至還有一些科技公司導(dǎo)致的用戶信息泄露,這表明上述措施還不夠充分。
為此,研究人員新開發(fā)了一種統(tǒng)計方法,來測試能夠準(zhǔn)確估算通過匿名數(shù)據(jù)集正確地識別個體身份的可能性。研究人員發(fā)現(xiàn),只需要知道少數(shù)幾個數(shù)據(jù),如郵政編碼、出生日期、性別和子女?dāng)?shù)量,一般就能夠以高可信度重新識別出個體身份,即使這些數(shù)據(jù)集是不完整的。
并且隨著已知數(shù)據(jù)越多,識別的可能性越大。例如,99.98%的馬薩諸塞州人口,可以通過15個人口統(tǒng)計學(xué)數(shù)據(jù)識別出來。
因此,研究團(tuán)隊總結(jié)認(rèn)為,目前通常所采用的只公布取樣數(shù)據(jù)集或不完全數(shù)據(jù)集,尚不足以很好地保護(hù)個人隱私。