當前位置：首頁 > 智能硬件 > 人工智能AI

人工智能發(fā)展出了豐富的應(yīng)用模式從而衍生出繁多的“變臉應(yīng)用”

時間：2020-05-05 14:54:01

關(guān)鍵字：人工智能計算機視覺 GAN 機器學習

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 隨著計算機視覺技術(shù)的成熟，圖像識別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。因“人臉”這一元素與個人身份的直接聯(lián)系，相關(guān)針對人臉的圖像處理技術(shù)因識別度高、代入感強等原因，在文化娛樂領(lǐng)域發(fā)展出了豐富的

隨著計算機視覺技術(shù)的成熟，圖像識別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。因“人臉”這一元素與個人身份的直接聯(lián)系，相關(guān)針對人臉的圖像處理技術(shù)因識別度高、代入感強等原因，在文化娛樂領(lǐng)域發(fā)展出了豐富的應(yīng)用模式，從而衍生出繁多的“變臉應(yīng)用”。

隨著計算機視覺技術(shù)的成熟，圖像識別、圖像處理等技術(shù)任務(wù)發(fā)展出了大量應(yīng)用。其中，針對“人臉”的識別與處理任務(wù)尤為熱門，其在安防、支付、公共服務(wù)等領(lǐng)域均有相對成熟的應(yīng)用，并形成產(chǎn)業(yè)鏈。此外，因“人臉”這一元素與個人身份的直接聯(lián)系，相關(guān)針對人臉的圖像處理技術(shù)因識別度高、代入感強等原因，在文化娛樂領(lǐng)域同樣發(fā)展出了豐富的應(yīng)用模式，從而衍生出繁多的“變臉應(yīng)用”。

01 計算機視覺發(fā)展下的人臉識別與圖像處理

在當前的人工智能大潮下，計算機視覺的發(fā)展及其在人臉識別上的應(yīng)用已發(fā)展出廣泛的應(yīng)用場景。據(jù)統(tǒng)計，2013年中國人臉識別市場規(guī)模僅為8.61億元，2014年突破10億元，并長期保持逐年快速增長的趨勢。伴隨火車站、零售支付以及安防等領(lǐng)域的應(yīng)用需求，中國人臉識別市場在2018年以高達27.6億元。然而，除卻管理與安全防衛(wèi)的需要，人臉識別技術(shù)在文化娛樂的場景同樣擁有極大的熱度，尤其針對“人臉”的圖像處理領(lǐng)域，計算機視覺與遷移學習等技術(shù)已發(fā)展出“AI換臉”、“真人照片卡通化”等應(yīng)用模式，各類移動應(yīng)用屢見不鮮。此外，諸如“妝容轉(zhuǎn)移”、“染發(fā)劑效果模擬”等圍繞人臉圖像處理的應(yīng)用在零售營銷領(lǐng)域同樣存在不小的市場潛力。

02 圖像處理中常用人工智能技術(shù)

深度學習：機器學習的分支，因深度學習可以通過無監(jiān)督或半監(jiān)督特征學習算法和分層特征提取從海量數(shù)據(jù)中自動提取特征，使其在計算機視覺領(lǐng)域擁有極佳的應(yīng)用效果。

計算機視覺：指機器感知環(huán)境的能力，是關(guān)于研究機器視覺能力的學科。這一技術(shù)類別中的經(jīng)典任務(wù)有圖像生成、圖像處理、圖像提取和圖像的三維推理，是當前人工智能技術(shù)發(fā)展的重點應(yīng)用領(lǐng)域之一。

生成對抗網(wǎng)絡(luò)(GAN)：一種無監(jiān)督學習方法，是一種通過用對抗網(wǎng)絡(luò)來訓練生成模型的架構(gòu)。GAN在圖像生成上擁有極大優(yōu)勢，是當前最具發(fā)展?jié)摿Φ?u>神經(jīng)網(wǎng)絡(luò)之一。

遷移學習：遷移學習是一種機器學習方法，通過從已學習的相關(guān)任務(wù)中轉(zhuǎn)移知識來改進學習的新任務(wù)，可應(yīng)用于圖像處理中的換臉、畫風遷移等任務(wù)。

元學習：機器學習的一個子領(lǐng)域，是將自動學習算法應(yīng)用于機器學習實驗的元數(shù)據(jù)上，是通往可持續(xù)學習多項新任務(wù)的多面智能體的必經(jīng)之路，可被用于靜止圖像動態(tài)化等任務(wù)。

03 人工智能技術(shù)在人臉圖像處理領(lǐng)域的應(yīng)用分布

04 人工智能技術(shù)在圖像生成與處理領(lǐng)域的應(yīng)用案例

U-GAT-IT 模型實現(xiàn)真人照片到日式卡通頭像的自動轉(zhuǎn)化：韓國AI研究團隊基于生成對抗網(wǎng)絡(luò)（GAN）的架構(gòu)基礎(chǔ)，添加了注意力模塊，并發(fā)明了一種名為”自適應(yīng)層-實例歸一化“（AdaLIN）的歸一化機制，建立了一款針對圖片到圖片翻譯任務(wù)的全新神經(jīng)網(wǎng)絡(luò)模型，即“U-GAT-IT”。該模型可實現(xiàn)將真人頭像轉(zhuǎn)化為二次元卡通畫風的圖片，效果如同漫畫家的精心再創(chuàng)作。

美圖影像實驗室（MTlab）推出高效人像畫質(zhì)修復(fù)算法：美圖實驗室團隊通過借鑒前沿的深度學習技術(shù)，結(jié)合大量生成對抗網(wǎng)絡(luò)應(yīng)用打造了超清人像生成網(wǎng)絡(luò)結(jié)構(gòu)BeautyGAN。在此基礎(chǔ)上，基于上億人像數(shù)據(jù)的訓練，使其具備人像畫質(zhì)修復(fù)能力。通過部署該技術(shù)于于美圖秀秀APP，任何用戶可以在上傳低質(zhì)量照片后數(shù)秒內(nèi)收獲畫質(zhì)提升版本。

三星研發(fā)神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)一張圖像生成動圖：三星和Skolkovo研究團隊使用卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建頭像特性，通過元學習在頭像特寫語料庫上的大量預(yù)訓練（meta-learning），讓模型獲得基于少量圖像學習（few shotlearning）的能力。在元學習過程中，系統(tǒng)創(chuàng)建了三種神經(jīng)網(wǎng)絡(luò)：將幀映射到向量的嵌入器網(wǎng)絡(luò)、在合成視頻中映射面部特征點的生成器網(wǎng)絡(luò)以及評估生成圖像真實性和姿態(tài)的判別器網(wǎng)絡(luò)。聯(lián)合三種網(wǎng)絡(luò)并執(zhí)行長時間元學習的模型能夠利用已學習的高質(zhì)量生成器與判別器實現(xiàn)基于數(shù)張甚至一張靜止人像生成表情豐富的動圖。

05 人工智能在圖像處理領(lǐng)域中的局限性

技術(shù)精度限制：當前圖像處理技術(shù)的應(yīng)用仍存在瑕疵，其精度距離商用美術(shù)標準還有一定距離。

道德風險：在當下Deepfake和Zao等軟件被濫用的情況下，智能化的圖像處理技術(shù)將面臨極大的道德風險限制。

版權(quán)限制：針對藝術(shù)創(chuàng)作的版權(quán)條例與規(guī)范正在愈發(fā)嚴格，其變化或?qū)⑼瑯佑绊懙酱祟惣夹g(shù)的應(yīng)用范圍和未來發(fā)展。

社會安全因素：當變臉軟件的應(yīng)用對象涉及公眾人物乃至政府官員，其結(jié)果或?qū)е律鐣踩酥琳蜗蟮挠绊憽?/p>

06 人工智能在圖像處理領(lǐng)域的發(fā)展趨勢

創(chuàng)作高效化：游戲角色設(shè)計、服裝設(shè)計等內(nèi)容創(chuàng)作工作將會因智能技術(shù)所帶來的便捷性而更加便捷，使創(chuàng)作者能將更多精力使用在創(chuàng)意和思路的整理，從而讓創(chuàng)作更加高效。

營銷體驗直觀化：化妝品、服裝首飾等商品的營銷效果可以通過在用戶身上投影或模擬，從而為客戶帶來更直觀的體驗，加強營銷和體驗的效果。

文化保護智能化：伴隨數(shù)據(jù)的增加和算法的升級，文物的修補、視覺復(fù)原等工作將更加精準與便捷。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達成戰(zhàn)略合作協(xié)議，徹底改變云采用和管理方式

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動工具SODA V將顛覆汽車市場，使汽車開發(fā)時間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動 BSP

[美通社全球TMT]

從容應(yīng)對未知風險----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行，同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風險，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國游戲市場開始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報道，騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導體

[通信先鋒]

華為張平安：數(shù)字世界話語權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機衛(wèi)星通信

[美通社全球TMT]

中國通信服務(wù)公布2024年中期業(yè)績

要點：有效應(yīng)對環(huán)境變化，經(jīng)營業(yè)績穩(wěn)中有升落實提質(zhì)增效舉措，毛利潤率延續(xù)升勢戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競爭力堅持高質(zhì)量發(fā)展策略，塑強核心競爭優(yōu)勢...

關(guān)鍵字：通信 BSP 電信運營商數(shù)字經(jīng)濟

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]