我們如何判斷人工智能創(chuàng)作的藝術跟人類創(chuàng)作的藝術區(qū)別在哪?
人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學。人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論和技術日益成熟,應用領域也不斷擴大,可以設想,未來人工智能帶來的科技產品,將會是人類智慧的“容器”。人工智能可以對人的意識、思維的信息過程的模擬。人工智能不是人的智能,但能像人那樣思考、也可能超過人的智能。
人工智能是一門極富挑戰(zhàn)性的科學,從事這項工作的人必須懂得計算機知識,心理學和哲學。人工智能是包括十分廣泛的科學,它由不同的領域組成,如機器學習,計算機視覺等等,總的說來,人工智能研究的一個主要目標是使機器能夠勝任一些通常需要人類智能才能完成的復雜工作。但不同的時代、不同的人對這種“復雜工作”的理解是不同的。 [1] 2017年12月,人工智能入選“2017年度中國媒體十大流行語”。 [2] 2021年9月25日,為促進人工智能健康發(fā)展,《新一代人工智能倫理規(guī)范》發(fā)布。
要說現在互聯網什么玩法最火,那非莫屬AI了,從幾年前的AI識別、AI人像、AI語音,慢慢到后面的AI視頻和AI主播等等,AI這些年的進化速度相當驚人。
毫不夸張的說,AI領域已經逐漸覆蓋在我們老百姓的生活上了,甚至網上一搜一大堆相關的內容。
當然,在這項技術用途上,離我們不遠;但AI它真正的技術支持,是我們大多數人沒法接觸的。
AI即是人工智能,通過深度學習,來完成我們特定的某項任務,這背后需要強大的算力算法加持。
在AI技術日益成熟的今天,其中不乏被取代了一些苦力的勞動職位,導致失業(yè)的人也增多了。但世界發(fā)展需要的前提下,有些迭代過程是必不可少的。
AI再度成為輿論焦點。作為一個年經話題,這一次AI走紅不再是因為“產生智慧”,也沒有“勝天半子”的傳奇對決,但仍舊讓人震驚。
AI作畫正在成為趨勢之一??赡苣愫翢o藝術細胞,但只要在AI繪圖軟件里輸入幾個關鍵詞,再選擇想要的風格與視角,就能收獲一幅與AI共創(chuàng)的高水平畫作。憑借著令人驚異的技術水準與創(chuàng)作能力,AI作畫已經成為了海內外技術領域的頂流概念之一,短短一個多月里,無數AI畫作被生產出來,AI正氣勢洶洶地向人類引以為傲的藝術創(chuàng)作領域發(fā)起沖擊。
在一些人看來,這或許是另一種層面的“智械危機”。AI作畫到底發(fā)展到了何種程度?它真的會成為人類想象力與創(chuàng)造力的強敵嗎?帶著疑問,我也打開了一款AI繪圖軟件,在prompt關鍵詞部分輸入了“人工智能”“美術”“創(chuàng)作”等詞條。幾十秒后,一張超現實主義的畫作展示在我面前:
一個巨大的機器人靜默地矗立著,它的背后連接著復雜的機械裝置,空間里絢麗的色彩與冰冷的鋼鐵交相輝映。
2022年8月31日,一位名為Jason Allen的美國游戲設計師在美國科羅拉多州博覽會一項美術競賽中斬獲一等獎,獲獎的作品名為《空間歌劇院》。這幅畫作是一幅標準的太空歌劇風格的繪畫作品,只不過,它出自AI之手。
《空間歌劇院》是Jason Allen使用AI繪圖軟件MidJourney創(chuàng)作完成的,是在近千次的嘗試后生成的。消息一經發(fā)出,在全球藝術領域迅速引起熱議,利用AI參賽讓《空間歌劇院》及其作者陷入了口誅筆伐中。無獨有偶,同樣是在8月,美國媒體大西洋月刊的一位記者同樣因為利用MidJourney制作文章插畫而陷入爭議,一場全球范圍內的AI創(chuàng)作大討論就這樣拉開帷幕。
AI作畫的風頭正盛,用AI做視頻的應用也悄然而至。九月底Meta小扎公布了自家Make-A-Video的AI視頻制作工具。這款工具可以生成高質量的短視頻。Meta AI做視頻的新聞還沒有焐熱,谷歌也不甘示弱,推出了兩款AI生成視頻的工具:Imagen Video 和 Phenaki。前者傾向于打造視頻質量,后者傾向于視頻的邏輯與時長。這幾款AI視頻制作工具各有特色。
文本生成圖像的AI技術大火才不過幾個月,就直接躍升至文本生成動態(tài)視頻。從畫圖到做視頻,AI的發(fā)展速度令人訝異,同時令人對未來的數字媒體憧憬。那么,這種跨越到底會給未來帶來什么呢?
AI做視頻是AI作圖的延伸
在討論AI生成視頻會給未來帶來哪些改變前,我們先梳理下,AI生成視頻的技術原理和應用場景。
馮原:是的,藝術創(chuàng)作不是用算法來做的。這與數學邏輯不一樣,基于數學的算法可能并不需要情感。說到這里,就要涉及一個非常嚴肅的問題:如果我們能創(chuàng)造一種既擁有情感變化、也有內分泌機制的人工智能的話,這樣的AI才具有一顆“人類的心靈”,那么它才可能創(chuàng)造藝術。否則,算法處理的圖像由于沒有人類之心,它只能模仿但不具備自主創(chuàng)造和感知藝術的功能。
收藏周刊:我們似乎很難判斷人工智能創(chuàng)作的藝術跟人類創(chuàng)作的藝術區(qū)別在哪?
模型是算力、算法和數據三大基礎要素與應用場景之間的橋梁,模型既是算力、算法和數據三大基礎要素的綜合,又是解決應用場景需求的關鍵。模型是人工智能領域的核心概念,每一個人工智能應用都是針對應用場景的具體需求,建立或選取合適的模型,利用相應數據和算法對模型進行訓練擬合,然后再把訓練擬合好的模型提供推理服務,從而實現自動解決具體應用場景的任務。
模型具有較強的通用性,同一類模型可以在多個領域應用,解決多個場景的具體問題。往往從事模型開發(fā)領域的企業(yè),需要針對具體的應用場景進行模型開發(fā),形成對應的AI應用產品,也有些企業(yè)提供模型開發(fā)服務項目為主。關于模型的具體行業(yè)應用,將會在后續(xù)的內容里,結合具體行業(yè)應用再分析,在此還是圍繞模型本身的機會展開討論。
一、專業(yè)模型開發(fā)是AI技術領域的核心環(huán)節(jié),大模型、多模態(tài)以及小模型等方向值得重點關注。
專業(yè)模型一直是AI領域研究和創(chuàng)業(yè)的核心領域,主要圍繞視覺圖像、語音識別和自然語言處理,以及知識圖譜等方面,許多的專業(yè)模型就是為了解決這些領域的問題而誕生。近年來大模型的出現與發(fā)展,也帶來了圖像、語音和文本等多模態(tài)模型的融合發(fā)展。邊緣計算應用場景日趨豐富,小模型在邊緣終端優(yōu)勢明顯。
視覺圖像領域有企業(yè)和研究單位從事該領域的工作,視覺圖像領域模型可能是在行業(yè)應用中最廣泛或者最常見的AI模型,不僅誕生了“AI四小龍”,也產生了更多的細分領域的應用創(chuàng)新企業(yè),應用領域包括OCR、安防、自動駕駛等,也拓展到了醫(yī)療、工業(yè)、港口、水利、能源等更多的領域。
語音識別與合成,包括聲紋等領域也有許多企業(yè)和研究單位參與其中,目前在客服和交互等方面應用廣泛,聲紋作為一種新的身份認證方式也在互聯網和金融的相關賬戶系統(tǒng)中應用,另外關于語音方面的模型也開始遷移應用到工業(yè)機器運維等領域。
自然語言處理是為了讓計算機能夠處理和理解人類的語言,近年來自然語言處理與知識圖譜的結合越來越緊密,研究范圍也從基礎的分詞、表示等內容更多的向知識推理等更高難度的方向擴展,目前主流的大模型研究核心也是圍繞自然語言處理。自然語言處理在搜索、對話系統(tǒng)以及輿情分析等方面應用廣泛。
Transformer模型最早是解決NLP的經典模型,現在也廣泛的應用于圖像和語音等方面,甚至在藥物研發(fā)大分子發(fā)現方面主要也是基于Transformer模型的應用。許多的大模型和多模態(tài)模型,許多也是基于Transformer模型實現。