人工智能發(fā)展出了豐富的應(yīng)用模式 從而衍生出繁多的“變臉應(yīng)用”
掃描二維碼
隨時(shí)隨地手機(jī)看文章
隨著計(jì)算機(jī)視覺技術(shù)的成熟,圖像識(shí)別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。因“人臉”這一元素與個(gè)人身份的直接聯(lián)系,相關(guān)針對(duì)人臉的圖像處理技術(shù)因識(shí)別度高、代入感強(qiáng)等原因,在文化娛樂領(lǐng)域發(fā)展出了豐富的應(yīng)用模式,從而衍生出繁多的“變臉應(yīng)用”。
隨著計(jì)算機(jī)視覺技術(shù)的成熟,圖像識(shí)別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。其中,針對(duì)“人臉”的識(shí)別與處理任務(wù)尤為熱門,其在安防、支付、公共服務(wù)等領(lǐng)域均有相對(duì)成熟的應(yīng)用,并形成產(chǎn)業(yè)鏈。 此外,因“人臉”這一元素與個(gè)人身份的直接聯(lián)系,相關(guān)針對(duì)人臉的圖像處理技術(shù)因識(shí)別度高、代入感強(qiáng)等原因,在文化娛樂領(lǐng)域同樣發(fā)展出了豐富的應(yīng)用模式,從而衍生出繁多的“變臉應(yīng)用”。
01 計(jì)算機(jī)視覺發(fā)展下的人臉識(shí)別與圖像處理
在當(dāng)前的人工智能大潮下,計(jì)算機(jī)視覺的發(fā)展及其在人臉識(shí)別上的應(yīng)用已發(fā)展出廣泛的應(yīng)用場(chǎng)景。據(jù)統(tǒng)計(jì),2013年中國人臉識(shí)別市場(chǎng)規(guī)模僅為8.61億元,2014年突破10億元,并長期保持逐年快速增長的趨勢(shì)。伴隨火車站、零售支付以及安防等領(lǐng)域的應(yīng)用需求,中國人臉識(shí)別市場(chǎng)在2018年以高達(dá)27.6億元。然而,除卻管理與安全防衛(wèi)的需要,人臉識(shí)別技術(shù)在文化娛樂的場(chǎng)景同樣擁有極大的熱度,尤其針對(duì)“人臉”的圖像處理領(lǐng)域,計(jì)算機(jī)視覺與遷移學(xué)習(xí)等技術(shù)已發(fā)展出“AI換臉”、“真人照片卡通化”等應(yīng)用模式,各類移動(dòng)應(yīng)用屢見不鮮。此外,諸如“妝容轉(zhuǎn)移”、“染發(fā)劑效果模擬”等圍繞人臉圖像處理的應(yīng)用在零售營銷領(lǐng)域同樣存在不小的市場(chǎng)潛力。
02 圖像處理中常用人工智能技術(shù)
深度學(xué)習(xí):機(jī)器學(xué)習(xí)的分支,因深度學(xué)習(xí)可以通過無監(jiān)督或半監(jiān)督特征學(xué)習(xí)算法和分層特征提取從海量數(shù)據(jù)中自動(dòng)提取特征,使其在計(jì)算機(jī)視覺領(lǐng)域擁有極佳的應(yīng)用效果。
計(jì)算機(jī)視覺:指機(jī)器感知環(huán)境的能力,是關(guān)于研究機(jī)器視覺能力的學(xué)科。這一技術(shù)類別中的經(jīng)典任務(wù)有圖像生成、圖像處理、圖像提取和圖像的三維推理,是當(dāng)前人工智能技術(shù)發(fā)展的重點(diǎn)應(yīng)用領(lǐng)域之一。
生成對(duì)抗網(wǎng)絡(luò)(GAN):一種無監(jiān)督學(xué)習(xí)方法,是一種通過用對(duì)抗網(wǎng)絡(luò)來訓(xùn)練生成模型的架構(gòu)。GAN在圖像生成上擁有極大優(yōu)勢(shì),是當(dāng)前最具發(fā)展?jié)摿Φ?u>神經(jīng)網(wǎng)絡(luò)之一。
遷移學(xué)習(xí):遷移學(xué)習(xí)是一種機(jī)器學(xué)習(xí)方法,通過從已學(xué)習(xí)的相關(guān)任務(wù)中轉(zhuǎn)移知識(shí)來改進(jìn)學(xué)習(xí)的新任務(wù),可應(yīng)用于圖像處理中的換臉、畫風(fēng)遷移等任務(wù)。
元學(xué)習(xí):機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,是將自動(dòng)學(xué)習(xí)算法應(yīng)用于機(jī)器學(xué)習(xí)實(shí)驗(yàn)的元數(shù)據(jù)上,是通往可持續(xù)學(xué)習(xí)多項(xiàng)新任務(wù)的多面智能體的必經(jīng)之路,可被用于靜止圖像動(dòng)態(tài)化等任務(wù)。
03 人工智能技術(shù)在人臉圖像處理領(lǐng)域的應(yīng)用分布
04 人工智能技術(shù)在圖像生成與處理領(lǐng)域的應(yīng)用案例
U-GAT-IT 模型實(shí)現(xiàn)真人照片到日式卡通頭像的自動(dòng)轉(zhuǎn)化:韓國AI研究團(tuán)隊(duì)基于生成對(duì)抗網(wǎng)絡(luò)(GAN)的架構(gòu)基礎(chǔ),添加了注意力模塊,并發(fā)明了一種名為”自適應(yīng)層-實(shí)例歸一化“(AdaLIN)的歸一化機(jī)制,建立了一款針對(duì)圖片到圖片翻譯任務(wù)的全新神經(jīng)網(wǎng)絡(luò)模型,即“U-GAT-IT”。該模型可實(shí)現(xiàn)將真人頭像轉(zhuǎn)化為二次元卡通畫風(fēng)的圖片,效果如同漫畫家的精心再創(chuàng)作。
美圖影像實(shí)驗(yàn)室(MTlab)推出高效人像畫質(zhì)修復(fù)算法:美圖實(shí)驗(yàn)室團(tuán)隊(duì)通過借鑒前沿的深度學(xué)習(xí)技術(shù),結(jié)合大量生成對(duì)抗網(wǎng)絡(luò)應(yīng)用打造了超清人像生成網(wǎng)絡(luò)結(jié)構(gòu)BeautyGAN。在此基礎(chǔ)上,基于上億人像數(shù)據(jù)的訓(xùn)練,使其具備人像畫質(zhì)修復(fù)能力。通過部署該技術(shù)于于美圖秀秀APP,任何用戶可以在上傳低質(zhì)量照片后數(shù)秒內(nèi)收獲畫質(zhì)提升版本。
三星研發(fā)神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)一張圖像生成動(dòng)圖:三星和Skolkovo研究團(tuán)隊(duì)使用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建頭像特性,通過元學(xué)習(xí)在頭像特寫語料庫上的大量預(yù)訓(xùn)練(meta-learning),讓模型獲得基于少量圖像學(xué)習(xí)(few shotlearning)的能力。在元學(xué)習(xí)過程中,系統(tǒng)創(chuàng)建了三種神經(jīng)網(wǎng)絡(luò):將幀映射到向量的嵌入器網(wǎng)絡(luò)、在合成視頻中映射面部特征點(diǎn)的生成器網(wǎng)絡(luò)以及評(píng)估生成圖像真實(shí)性和姿態(tài)的判別器網(wǎng)絡(luò)。聯(lián)合三種網(wǎng)絡(luò)并執(zhí)行長時(shí)間元學(xué)習(xí)的模型能夠利用已學(xué)習(xí)的高質(zhì)量生成器與判別器實(shí)現(xiàn)基于數(shù)張甚至一張靜止人像生成表情豐富的動(dòng)圖。
05 人工智能在圖像處理領(lǐng)域中的局限性
技術(shù)精度限制:當(dāng)前圖像處理技術(shù)的應(yīng)用仍存在瑕疵,其精度距離商用美術(shù)標(biāo)準(zhǔn)還有一定距離。
道德風(fēng)險(xiǎn):在當(dāng)下Deepfake和Zao等軟件被濫用的情況下,智能化的圖像處理技術(shù)將面臨極大的道德風(fēng)險(xiǎn)限制。
版權(quán)限制:針對(duì)藝術(shù)創(chuàng)作的版權(quán)條例與規(guī)范正在愈發(fā)嚴(yán)格,其變化或?qū)⑼瑯佑绊懙酱祟惣夹g(shù)的應(yīng)用范圍和未來發(fā)展。
社會(huì)安全因素:當(dāng)變臉軟件的應(yīng)用對(duì)象涉及公眾人物乃至政府官員,其結(jié)果或?qū)?dǎo)致社會(huì)安全乃至政府形象的影響。
06 人工智能在圖像處理領(lǐng)域的發(fā)展趨勢(shì)
創(chuàng)作高效化:游戲角色設(shè)計(jì)、服裝設(shè)計(jì)等內(nèi)容創(chuàng)作工作將會(huì)因智能技術(shù)所帶來的便捷性而更加便捷,使創(chuàng)作者能將更多精力使用在創(chuàng)意和思路的整理,從而讓創(chuàng)作更加高效。
營銷體驗(yàn)直觀化:化妝品、服裝首飾等商品的營銷效果可以通過在用戶身上投影或模擬,從而為客戶帶來更直觀的體驗(yàn),加強(qiáng)營銷和體驗(yàn)的效果。
文化保護(hù)智能化:伴隨數(shù)據(jù)的增加和算法的升級(jí),文物的修補(bǔ)、視覺復(fù)原等工作將更加精準(zhǔn)與便捷。