在學習期間調整生成器的權重,目標是使生成的圖像與該類的真實圖像盡可能相似,以至于判別器無法區(qū)分出來。
以下是最大的GAN(https://arxiv.org/abs/1809.11096)生成的圖像示例。
關于GAN在keras上的實現,請參閱: https://github.com/eriklindernoren/Keras-GAN
??計算機視覺所需硬件
要訓練大型模型,需要用到大量資源。實現這一目標有兩種方法。首先是使用云服務,比如google cloud或者aws。第二種方法是自己組裝一臺帶有GPU的計算機。
只需1000美元,就可以組裝一臺相當好的機器來訓練深度學習模型。
更多細節(jié)請參閱:?https://hypraptive.github.io/2017/02/13/dl-computer-build.html
計算機視覺的用戶界面
ownphotos的face儀表盤
Ownphotos?是一個令人驚嘆的用戶界面,允許您導入照片并自動計算臉部嵌入,進行目標識別和人臉識別。
它用到的算法:
人臉識別:face_recognition目標檢測:densecap,?places365
應用
計算機視覺有很多應用:
個人圖片整理自動駕駛汽車自動無人機驗證碼識別/OCR過濾網站/應用程序上的圖片自動標記應用程序的圖片從視頻(電視節(jié)目,電影)中提取信息視覺問答:結合自然語言處理和計算機視覺藝術:生成式對抗網絡
??結論
正如我們這里所見,上述視覺領域各方面的實現中誕生了許多新的有趣的方法和應用。
我認為人工智能最有趣的,在各領域尤其在視覺領域中,是學習可再使用的算法。讓這些方法適用于處理越來越多的任務而不需要更多算力資源和數據 :
遷移學習 : 使快速重新訓練預處理了的大型神經網絡成為可能嵌入 (例如facenet)?: 使識別許多類而無需對這些類進行訓練成為可能