誰才是人工智能的堅強(qiáng)后盾
近年來,以深度學(xué)習(xí)算法為代表的人工智能技術(shù)快速發(fā)展,在計算機(jī)視覺、語音識別、語義理解等領(lǐng)域都實(shí)現(xiàn)了突破。但其相關(guān)算法目前并不完美,有待繼續(xù)加強(qiáng)理論性研究,也不斷有很多新的算法理論成果被提出,如膠囊網(wǎng)絡(luò)、生成對抗網(wǎng)絡(luò)、遷移學(xué)習(xí)等。
膠囊網(wǎng)絡(luò)是為了克服卷積神經(jīng)網(wǎng)絡(luò)的局限性而提出的一種新的網(wǎng)絡(luò)架構(gòu)。卷積神經(jīng)網(wǎng)絡(luò)存在著難以識別圖像中的位置關(guān)系、缺少空間分層和空間推理能力等局限性。受到神經(jīng)科學(xué)的啟發(fā),人工智能領(lǐng)軍人物 Hinton 提出了膠囊網(wǎng)絡(luò)的概念。
膠囊網(wǎng)絡(luò)由膠囊而不是由神經(jīng)元構(gòu)成,膠囊由一小群神經(jīng)元組成,輸出為向量,向量的長度表示物體存在的估計概率,向量的方向表示物體的姿態(tài)參數(shù)。膠囊網(wǎng)絡(luò)能同時處理多個不同目標(biāo)的多種空間變換,所需訓(xùn)練數(shù)據(jù)量小,從而可以有效地克服卷積神經(jīng)網(wǎng)絡(luò)的局限性,理論上更接近人腦的行為。但膠囊網(wǎng)絡(luò)也存在著計算量大、大圖像處理上效果欠佳等問題,有待進(jìn)一步研究。
生成對抗網(wǎng)絡(luò)(GAN: Generative Adversarial Networks)是于 2014年提出的一種生成模型。該算法核心思想來源于博弈論的納什均衡,通過生成器和判別器的對抗訓(xùn)練進(jìn)行迭代優(yōu)化,目標(biāo)是學(xué)習(xí)真實(shí)數(shù)據(jù)的分布,從而可以產(chǎn)生全新的、與觀測數(shù)據(jù)類似的數(shù)據(jù)。與其他生成模型相比,GAN 有生成效率高、設(shè)計框架靈活、可生成具有更質(zhì)量的樣本等優(yōu)勢,2016 年以來研究工作呈爆發(fā)式增長,已成為人工智能一個熱門的研究方向。但 GAN 仍存在難以訓(xùn)練、梯度消失、模式崩潰等問題,仍處于不斷研究探索的階段。
遷移學(xué)習(xí)是利用數(shù)據(jù)、任務(wù)或模型之間的相似性,將學(xué)習(xí)過的模型應(yīng)用于新領(lǐng)域的一類算法。遷移學(xué)習(xí)可大大降低深度網(wǎng)絡(luò)訓(xùn)練所需的數(shù)據(jù)量,縮短訓(xùn)練時間。其中,F(xiàn)ine-Tune 是深度遷移學(xué)習(xí)簡單的一種實(shí)現(xiàn)方式,通過將一個問題上訓(xùn)練好的模型進(jìn)行簡單的調(diào)整使其適用于一個新的問題,具有節(jié)省時間成本、模型泛化能力好、實(shí)現(xiàn)簡單、少量的訓(xùn)練數(shù)據(jù)就可以達(dá)到較好效果的優(yōu)勢,已獲得廣泛應(yīng)用。