在美劇《硅谷》中,曾出現(xiàn)一個基于深度學(xué)習(xí)來識別熱狗的 app : Not Hotdog ,可過去 AI 要識別一種食物已經(jīng)不容易,但在未來你每一個細(xì)微的動作可能都逃不過 AI 的眼睛。
最近 Netflix 的高級數(shù)據(jù)科技學(xué)家 Amir Ziai 發(fā)布了一項新的研究,用 AI 識別電影中接吻場景,這項技術(shù)看似無聊,但對于視頻行業(yè)卻有著重要的意義。一般來說接吻場景會出現(xiàn)在影視作品高潮和關(guān)鍵節(jié)點,有了這項技術(shù),視頻網(wǎng)站可以直接在視頻中標(biāo)記,方便用戶檢索和查看,甚至可以自動剪輯成視頻集錦推送給用戶。
此外如果你是個戀愛新手,或許還能通過這個工具快速學(xué)習(xí)一下電影中的那些接吻技巧,速成接吻十八式(誤)。但是要讓機(jī)器看懂人是怎么接吻并容易,Amir Ziai 建立了一個 2.3TB 的數(shù)據(jù)庫,包含了從 1915 年到 2016 年的 600 部好萊塢電影,包括不同的類型,每部大小在 200MB 到 12 GB 之間。
Amir Ziai 選取了其中 100 部電影進(jìn)行手動標(biāo)記,總共標(biāo)記 263 個接吻片段和 363 個非接吻片段,時長從 10 秒到 120 秒不等,而且每個標(biāo)記片段都會提取圖像特征和音頻特征。也就是說,AI 鑒定電影中的角色是否接吻,除了「看畫面」,還會「聽聲音」,這有助于提高識別的準(zhǔn)確率。經(jīng)過測試,Amir Ziai 發(fā)現(xiàn)這套系統(tǒng)的識別接吻的準(zhǔn)確率達(dá)到 95%。
正如 Amir Ziai 在研究中采取的方法,目前訓(xùn)練 AI 還離不開人工。類似的技術(shù)其實在優(yōu)酷等視頻網(wǎng)站已經(jīng)開始應(yīng)用,甚至還出現(xiàn)一種叫做「吻戲鑒定師」的新職業(yè)。去年優(yōu)酷一個 29 歲的「吻戲鑒定師」吉恒杉就曾登上熱搜,據(jù)吉恒杉介紹,為了教會計算機(jī)識別接吻等場景,需要從圖片庫和視頻中截取數(shù)千幅照片,一張一張標(biāo)記「接吻」的畫面。
光接吻場景就需要標(biāo)注 2000 多張照片,目前已經(jīng)為「接吻」這個標(biāo)簽做了兩萬多張圖像的標(biāo)注。據(jù)稱以目前阿里巴巴的視頻識別技術(shù),可以在 10 秒對 5 分鐘的視頻進(jìn)行識別標(biāo)記。以電視劇《三生三世十里桃花》,機(jī)器會將單集 50 分鐘的視頻切割成 3000 幀圖片,只要 5 秒鐘就能挑出楊冪和趙又廷的吻戲。
目前類似的技術(shù)正在向更多場景拓展,比如識別體育賽事中進(jìn)球、投籃、慶祝等動作,甚至應(yīng)用在視頻之外的更多場景。據(jù)《華爾街日報》報道,中國平安正在使用面部識別系統(tǒng)識別客戶臉上的微表情,以決定是否接受他們的投保,從 2016 年開始中國平安已經(jīng)將這項技術(shù)應(yīng)用于消費金融部門,作為發(fā)放貸款時風(fēng)險評估的一部分。
有意思的是,根據(jù)國際權(quán)威人臉識別數(shù)據(jù)庫 LFW 2107 年的一份測試結(jié)果,中國平安旗下平安科技的人臉識別技術(shù)以 99.8% 的識別精度和最低的波動幅度領(lǐng)先蘋果、Google 等科技巨頭,位居世界第一。而日本一家人工智能公司 Vaak 開發(fā)出的一款 AI 軟件,能通過分析顧客的神情和肢體動作,從而找出潛在的扒手,并提醒店員注意,去年還在一家便利店就成功識別出一名可疑的顧客。
這種 AI 分析技術(shù)除了可用于零售商,未來還能在火車站臺等公眾場所預(yù)防自殺 ,將有自殺傾向的人檢測出來,提前阻止跳軌自殺等悲劇發(fā)生。
從靜態(tài)的圖片到動態(tài)的畫面,AI 識別的能力越來越強(qiáng),但這也引發(fā)了一些人的擔(dān)憂。美國公民自由聯(lián)盟(ACLU)最近在一份報告中指出,人工智能技術(shù)的進(jìn)步使得攝像頭更加聰明,可能會讓我們的每個動作都被識別,如果不加以控制,可能會引發(fā)不少隱私問題。
上周微軟主動刪除了其最大的公共人臉識別數(shù)據(jù)庫 MS Celeb,可能就是擔(dān)心這些數(shù)據(jù)和相關(guān)技術(shù)被濫用,但這不會影響 AI 技術(shù)不斷進(jìn)步,在不久的將來還可能引發(fā)更多的爭議。