楊強(qiáng)談AI發(fā)展遇到的大數(shù)據(jù)困境以及解決辦法
近日,2018中國人工智能大會在深圳舉行。會上,國際人工智能聯(lián)合會(IJCAI)主席、AAAI/ACM/IEEE Fellow、香港科技大學(xué)教授楊強(qiáng)發(fā)表了題為《AI面臨的挑戰(zhàn)和遷移學(xué)習(xí)所帶來的機(jī)遇》的演講,談到了AI發(fā)展遇到的大數(shù)據(jù)的困境以及解決辦法。
楊強(qiáng)表示,我們正處于大數(shù)據(jù)驅(qū)動的AI時代,人們將工作數(shù)字化,然后通過人工智能自動化,從而提高效率。但是,現(xiàn)在我們越來越多的遇到了數(shù)據(jù)的困擾,很多企業(yè)的數(shù)據(jù)都是孤島沒有辦法打通,同時受制于歐盟GDPR等法案的制約,增大了這種困境。
楊強(qiáng)教授具體講解了大數(shù)據(jù)面臨的兩大困境。
一大困境是面臨隱私、安全和監(jiān)督。以歐盟的GDPR為例,GDPR明文規(guī)定了用戶的“被遺忘權(quán)”,對使用自動化模型決策全面禁止,這對機(jī)器學(xué)習(xí)有重大影響,因為讓用戶同意使用并不容易,使用自主決策合法要滿足三點,包括合同處理的必要性、其他法律另行授權(quán),數(shù)據(jù)主體明確同意。
在數(shù)據(jù)隱私的監(jiān)管的大趨勢下,解決這一問題并不容易。楊強(qiáng)教授提出了聯(lián)邦遷移學(xué)習(xí)思路,這種思路希望建立起機(jī)器學(xué)習(xí)的企業(yè)生態(tài),各個企業(yè)自有數(shù)據(jù)不出本地,模型效果不變,在不違規(guī)的情況下建立一個虛擬模型。楊強(qiáng)教授表示,利用聯(lián)邦遷移學(xué)習(xí)加密技術(shù),協(xié)同建模,學(xué)習(xí)模型過程不交換用戶數(shù),不侵犯隱私。
另一大困境是小數(shù)據(jù)的困境,楊強(qiáng)教授提出了遷移學(xué)習(xí),并列舉了跨領(lǐng)域輿情分析的案例。
楊強(qiáng)最后表示,面對數(shù)據(jù)發(fā)展的困擾,希望利用聯(lián)邦遷移學(xué)習(xí)技術(shù)建立聯(lián)合建模解決方案,克服數(shù)據(jù)障礙。在法律規(guī)范的基礎(chǔ)上,各個參與方理解一致的共識機(jī)制,保障安全合規(guī)性。比如在金融領(lǐng)域,可以建立金融業(yè)聯(lián)邦遷移學(xué)習(xí)聯(lián)盟。