計(jì)算機(jī)視覺這么火,你真的懂嗎?
在學(xué)習(xí)期間調(diào)整生成器的權(quán)重,目標(biāo)是使生成的圖像與該類的真實(shí)圖像盡可能相似,以至于判別器無(wú)法區(qū)分出來(lái)。
以下是最大的GAN(https://arxiv.org/abs/1809.11096)生成的圖像示例。
關(guān)于GAN在keras上的實(shí)現(xiàn),請(qǐng)參閱: https://github.com/eriklindernoren/Keras-GAN
??計(jì)算機(jī)視覺所需硬件
要訓(xùn)練大型模型,需要用到大量資源。實(shí)現(xiàn)這一目標(biāo)有兩種方法。首先是使用云服務(wù),比如google cloud或者aws。第二種方法是自己組裝一臺(tái)帶有GPU的計(jì)算機(jī)。
只需1000美元,就可以組裝一臺(tái)相當(dāng)好的機(jī)器來(lái)訓(xùn)練深度學(xué)習(xí)模型。
更多細(xì)節(jié)請(qǐng)參閱:?https://hypraptive.github.io/2017/02/13/dl-computer-build.html
計(jì)算機(jī)視覺的用戶界面
ownphotos的face儀表盤
Ownphotos?是一個(gè)令人驚嘆的用戶界面,允許您導(dǎo)入照片并自動(dòng)計(jì)算臉部嵌入,進(jìn)行目標(biāo)識(shí)別和人臉識(shí)別。
它用到的算法:
人臉識(shí)別:face_recognition目標(biāo)檢測(cè):densecap,?places365
應(yīng)用
計(jì)算機(jī)視覺有很多應(yīng)用:
個(gè)人圖片整理自動(dòng)駕駛汽車自動(dòng)無(wú)人機(jī)驗(yàn)證碼識(shí)別/OCR過(guò)濾網(wǎng)站/應(yīng)用程序上的圖片自動(dòng)標(biāo)記應(yīng)用程序的圖片從視頻(電視節(jié)目,電影)中提取信息視覺問(wèn)答:結(jié)合自然語(yǔ)言處理和計(jì)算機(jī)視覺藝術(shù):生成式對(duì)抗網(wǎng)絡(luò)
??結(jié)論
正如我們這里所見,上述視覺領(lǐng)域各方面的實(shí)現(xiàn)中誕生了許多新的有趣的方法和應(yīng)用。
我認(rèn)為人工智能最有趣的,在各領(lǐng)域尤其在視覺領(lǐng)域中,是學(xué)習(xí)可再使用的算法。讓這些方法適用于處理越來(lái)越多的任務(wù)而不需要更多算力資源和數(shù)據(jù) :
遷移學(xué)習(xí) : 使快速重新訓(xùn)練預(yù)處理了的大型神經(jīng)網(wǎng)絡(luò)成為可能嵌入 (例如facenet)?: 使識(shí)別許多類而無(wú)需對(duì)這些類進(jìn)行訓(xùn)練成為可能