人工智能發(fā)展出了豐富的應(yīng)用模式 從而衍生出繁多的“變臉應(yīng)用”
隨著計算機視覺技術(shù)的成熟,圖像識別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。因“人臉”這一元素與個人身份的直接聯(lián)系,相關(guān)針對人臉的圖像處理技術(shù)因識別度高、代入感強等原因,在文化娛樂領(lǐng)域發(fā)展出了豐富的應(yīng)用模式,從而衍生出繁多的“變臉應(yīng)用”。
隨著計算機視覺技術(shù)的成熟,圖像識別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。其中,針對“人臉”的識別與處理任務(wù)尤為熱門,其在安防、支付、公共服務(wù)等領(lǐng)域均有相對成熟的應(yīng)用,并形成產(chǎn)業(yè)鏈。 此外,因“人臉”這一元素與個人身份的直接聯(lián)系,相關(guān)針對人臉的圖像處理技術(shù)因識別度高、代入感強等原因,在文化娛樂領(lǐng)域同樣發(fā)展出了豐富的應(yīng)用模式,從而衍生出繁多的“變臉應(yīng)用”。
01 計算機視覺發(fā)展下的人臉識別與圖像處理
在當前的人工智能大潮下,計算機視覺的發(fā)展及其在人臉識別上的應(yīng)用已發(fā)展出廣泛的應(yīng)用場景。據(jù)統(tǒng)計,2013年中國人臉識別市場規(guī)模僅為8.61億元,2014年突破10億元,并長期保持逐年快速增長的趨勢。伴隨火車站、零售支付以及安防等領(lǐng)域的應(yīng)用需求,中國人臉識別市場在2018年以高達27.6億元。然而,除卻管理與安全防衛(wèi)的需要,人臉識別技術(shù)在文化娛樂的場景同樣擁有極大的熱度,尤其針對“人臉”的圖像處理領(lǐng)域,計算機視覺與遷移學習等技術(shù)已發(fā)展出“AI換臉”、“真人照片卡通化”等應(yīng)用模式,各類移動應(yīng)用屢見不鮮。此外,諸如“妝容轉(zhuǎn)移”、“染發(fā)劑效果模擬”等圍繞人臉圖像處理的應(yīng)用在零售營銷領(lǐng)域同樣存在不小的市場潛力。
02 圖像處理中常用人工智能技術(shù)
深度學習:機器學習的分支,因深度學習可以通過無監(jiān)督或半監(jiān)督特征學習算法和分層特征提取從海量數(shù)據(jù)中自動提取特征,使其在計算機視覺領(lǐng)域擁有極佳的應(yīng)用效果。
計算機視覺:指機器感知環(huán)境的能力,是關(guān)于研究機器視覺能力的學科。這一技術(shù)類別中的經(jīng)典任務(wù)有圖像生成、圖像處理、圖像提取和圖像的三維推理,是當前人工智能技術(shù)發(fā)展的重點應(yīng)用領(lǐng)域之一。
生成對抗網(wǎng)絡(luò)(GAN):一種無監(jiān)督學習方法,是一種通過用對抗網(wǎng)絡(luò)來訓練生成模型的架構(gòu)。GAN在圖像生成上擁有極大優(yōu)勢,是當前最具發(fā)展?jié)摿Φ?u>神經(jīng)網(wǎng)絡(luò)之一。
遷移學習:遷移學習是一種機器學習方法,通過從已學習的相關(guān)任務(wù)中轉(zhuǎn)移知識來改進學習的新任務(wù),可應(yīng)用于圖像處理中的換臉、畫風遷移等任務(wù)。
元學習:機器學習的一個子領(lǐng)域,是將自動學習算法應(yīng)用于機器學習實驗的元數(shù)據(jù)上,是通往可持續(xù)學習多項新任務(wù)的多面智能體的必經(jīng)之路,可被用于靜止圖像動態(tài)化等任務(wù)。
03 人工智能技術(shù)在人臉圖像處理領(lǐng)域的應(yīng)用分布
04 人工智能技術(shù)在圖像生成與處理領(lǐng)域的應(yīng)用案例
U-GAT-IT 模型實現(xiàn)真人照片到日式卡通頭像的自動轉(zhuǎn)化:韓國AI研究團隊基于生成對抗網(wǎng)絡(luò)(GAN)的架構(gòu)基礎(chǔ),添加了注意力模塊,并發(fā)明了一種名為”自適應(yīng)層-實例歸一化“(AdaLIN)的歸一化機制,建立了一款針對圖片到圖片翻譯任務(wù)的全新神經(jīng)網(wǎng)絡(luò)模型,即“U-GAT-IT”。該模型可實現(xiàn)將真人頭像轉(zhuǎn)化為二次元卡通畫風的圖片,效果如同漫畫家的精心再創(chuàng)作。
美圖影像實驗室(MTlab)推出高效人像畫質(zhì)修復(fù)算法:美圖實驗室團隊通過借鑒前沿的深度學習技術(shù),結(jié)合大量生成對抗網(wǎng)絡(luò)應(yīng)用打造了超清人像生成網(wǎng)絡(luò)結(jié)構(gòu)BeautyGAN。在此基礎(chǔ)上,基于上億人像數(shù)據(jù)的訓練,使其具備人像畫質(zhì)修復(fù)能力。通過部署該技術(shù)于于美圖秀秀APP,任何用戶可以在上傳低質(zhì)量照片后數(shù)秒內(nèi)收獲畫質(zhì)提升版本。
三星研發(fā)神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)一張圖像生成動圖:三星和Skolkovo研究團隊使用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建頭像特性,通過元學習在頭像特寫語料庫上的大量預(yù)訓練(meta-learning),讓模型獲得基于少量圖像學習(few shotlearning)的能力。在元學習過程中,系統(tǒng)創(chuàng)建了三種神經(jīng)網(wǎng)絡(luò):將幀映射到向量的嵌入器網(wǎng)絡(luò)、在合成視頻中映射面部特征點的生成器網(wǎng)絡(luò)以及評估生成圖像真實性和姿態(tài)的判別器網(wǎng)絡(luò)。聯(lián)合三種網(wǎng)絡(luò)并執(zhí)行長時間元學習的模型能夠利用已學習的高質(zhì)量生成器與判別器實現(xiàn)基于數(shù)張甚至一張靜止人像生成表情豐富的動圖。
05 人工智能在圖像處理領(lǐng)域中的局限性
技術(shù)精度限制:當前圖像處理技術(shù)的應(yīng)用仍存在瑕疵,其精度距離商用美術(shù)標準還有一定距離。
道德風險:在當下Deepfake和Zao等軟件被濫用的情況下,智能化的圖像處理技術(shù)將面臨極大的道德風險限制。
版權(quán)限制:針對藝術(shù)創(chuàng)作的版權(quán)條例與規(guī)范正在愈發(fā)嚴格,其變化或?qū)⑼瑯佑绊懙酱祟惣夹g(shù)的應(yīng)用范圍和未來發(fā)展。
社會安全因素:當變臉軟件的應(yīng)用對象涉及公眾人物乃至政府官員,其結(jié)果或?qū)е律鐣踩酥琳蜗蟮挠绊憽?/p>
06 人工智能在圖像處理領(lǐng)域的發(fā)展趨勢
創(chuàng)作高效化:游戲角色設(shè)計、服裝設(shè)計等內(nèi)容創(chuàng)作工作將會因智能技術(shù)所帶來的便捷性而更加便捷,使創(chuàng)作者能將更多精力使用在創(chuàng)意和思路的整理,從而讓創(chuàng)作更加高效。
營銷體驗直觀化:化妝品、服裝首飾等商品的營銷效果可以通過在用戶身上投影或模擬,從而為客戶帶來更直觀的體驗,加強營銷和體驗的效果。
文化保護智能化:伴隨數(shù)據(jù)的增加和算法的升級,文物的修補、視覺復(fù)原等工作將更加精準與便捷。