楊強(qiáng)談AI發(fā)展遇到的大數(shù)據(jù)困境以及解決辦法
近日,2018中國(guó)人工智能大會(huì)在深圳舉行。會(huì)上,國(guó)際人工智能聯(lián)合會(huì)(IJCAI)主席、AAAI/ACM/IEEE Fellow、香港科技大學(xué)教授楊強(qiáng)發(fā)表了題為《AI面臨的挑戰(zhàn)和遷移學(xué)習(xí)所帶來的機(jī)遇》的演講,談到了AI發(fā)展遇到的大數(shù)據(jù)的困境以及解決辦法。
楊強(qiáng)表示,我們正處于大數(shù)據(jù)驅(qū)動(dòng)的AI時(shí)代,人們將工作數(shù)字化,然后通過人工智能自動(dòng)化,從而提高效率。但是,現(xiàn)在我們?cè)絹碓蕉嗟挠龅搅藬?shù)據(jù)的困擾,很多企業(yè)的數(shù)據(jù)都是孤島沒有辦法打通,同時(shí)受制于歐盟GDPR等法案的制約,增大了這種困境。
楊強(qiáng)教授具體講解了大數(shù)據(jù)面臨的兩大困境。
一大困境是面臨隱私、安全和監(jiān)督。以歐盟的GDPR為例,GDPR明文規(guī)定了用戶的“被遺忘權(quán)”,對(duì)使用自動(dòng)化模型決策全面禁止,這對(duì)機(jī)器學(xué)習(xí)有重大影響,因?yàn)樽層脩敉馐褂貌⒉蝗菀?,使用自主決策合法要滿足三點(diǎn),包括合同處理的必要性、其他法律另行授權(quán),數(shù)據(jù)主體明確同意。
在數(shù)據(jù)隱私的監(jiān)管的大趨勢(shì)下,解決這一問題并不容易。楊強(qiáng)教授提出了聯(lián)邦遷移學(xué)習(xí)思路,這種思路希望建立起機(jī)器學(xué)習(xí)的企業(yè)生態(tài),各個(gè)企業(yè)自有數(shù)據(jù)不出本地,模型效果不變,在不違規(guī)的情況下建立一個(gè)虛擬模型。楊強(qiáng)教授表示,利用聯(lián)邦遷移學(xué)習(xí)加密技術(shù),協(xié)同建模,學(xué)習(xí)模型過程不交換用戶數(shù),不侵犯隱私。
另一大困境是小數(shù)據(jù)的困境,楊強(qiáng)教授提出了遷移學(xué)習(xí),并列舉了跨領(lǐng)域輿情分析的案例。
楊強(qiáng)最后表示,面對(duì)數(shù)據(jù)發(fā)展的困擾,希望利用聯(lián)邦遷移學(xué)習(xí)技術(shù)建立聯(lián)合建模解決方案,克服數(shù)據(jù)障礙。在法律規(guī)范的基礎(chǔ)上,各個(gè)參與方理解一致的共識(shí)機(jī)制,保障安全合規(guī)性。比如在金融領(lǐng)域,可以建立金融業(yè)聯(lián)邦遷移學(xué)習(xí)聯(lián)盟。