www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 智能硬件 > 智能硬件
[導(dǎo)讀]本文來自CMU的博士,MIT的博士后,vision.ai的聯(lián)合創(chuàng)始人Tomasz Malisiewicz的個人博客文章,閱讀本文,你可以更好的理解計算機(jī)視覺是怎么一回事,同時對機(jī)器學(xué)習(xí)是如何隨著時間緩慢發(fā)展的也有個直觀的認(rèn)識。

 本文我們來關(guān)注下三個非常相關(guān)的概念(深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和模式識別),以及他們與2015年最熱門的科技主題(機(jī)器人和人工智能)的聯(lián)系。

 


 

圖1 人工智能并非將人放入一臺計算機(jī)中(圖片來源于 WorkFusion 的博客)

環(huán)繞四周,你會發(fā)現(xiàn)不缺乏一些初創(chuàng)的高科技公司招聘機(jī)器學(xué)習(xí)專家的崗位。而其中只有一小部分需要深度學(xué)習(xí)專家。我敢打賭,大多數(shù)初創(chuàng)公司都可以從最基本的數(shù)據(jù)分析中獲益。那如何才能發(fā)現(xiàn)未來的數(shù)據(jù)科學(xué)家?你需要學(xué)習(xí)他們的思考方式。

三個與“學(xué)習(xí)”高度相關(guān)的流行詞匯

模式識別(Pattern recognition)、機(jī)器學(xué)習(xí)(machine learning)和深度學(xué)習(xí)(deep learning)代表三種不同的思想流派。模式識別是最古老的(作為一個術(shù)語而言,可以說是很過時的)。機(jī)器學(xué)習(xí)是最基礎(chǔ)的(當(dāng)下初創(chuàng)公司和研究實(shí)驗(yàn)室的熱點(diǎn)領(lǐng)域之一)。而深度學(xué)習(xí)是非常嶄新和有影響力的前沿領(lǐng)域,我們甚至不會去思考后深度學(xué)習(xí)時代。我們可以看下圖所示的谷歌趨勢圖??梢钥吹剑?/p>

1)機(jī)器學(xué)習(xí)就像是一個真正的冠軍一樣持續(xù)昂首而上;

2)模式識別一開始主要是作為機(jī)器學(xué)習(xí)的代名詞;

3)模式識別正在慢慢沒落和消亡;

4)深度學(xué)習(xí)是個嶄新的和快速攀升的領(lǐng)域。

 


 

2004年至今三個概念的谷歌搜索指數(shù)(圖來源于 谷歌趨勢 )

1. 模式識別:智能程序的誕生

模式識別是70年代和80年代非常流行的一個術(shù)語。它強(qiáng)調(diào)的是如何讓一個計算機(jī)程序去做一些看起來很“智能”的事情,例如識別“3”這個數(shù)字。而且在融入了很多的智慧和直覺后,人們也的確構(gòu)建了這樣的一個程序。例如,區(qū)分“3”和“B”或者“3”和“8”。早在以前,大家也不會去關(guān)心你是怎么實(shí)現(xiàn)的,只要這個機(jī)器不是由人躲在盒子里面?zhèn)窝b的就好(圖2)。不過,如果你的算法對圖像應(yīng)用了一些像濾波器、邊緣檢測和形態(tài)學(xué)處理等等高大上的技術(shù)后,模式識別社區(qū)肯定就會對它感興趣。光學(xué)字符識別就是從這個社區(qū)誕生的。因此,把模式識別稱為70年代,80年代和90年代初的“智能”信號處理是合適的。決策樹、啟發(fā)式和二次判別分析等全部誕生于這個時代。而且,在這個時代,模式識別也成為了計算機(jī)科學(xué)領(lǐng)域的小伙伴搞的東西,而不是電子工程。從這個時代誕生的模式識別領(lǐng)域最著名的書之一是由Duda & Hart執(zhí)筆的“模式識別(Pattern Classification)”。對基礎(chǔ)的研究者來說,仍然是一本不錯的入門教材。不過對于里面的一些詞匯就不要太糾結(jié)了,因?yàn)檫@本書已經(jīng)有一定的年代了,詞匯會有點(diǎn)過時。

 


 

圖2 一個字符“3”的圖像被劃分為16個子塊。

自定義規(guī)則、自定義決策,以及自定義“智能”程序在這個任務(wù)上,曾經(jīng)都風(fēng)靡一時(更多信息,可以查看這個 OCR 網(wǎng)頁)

小測試:計算機(jī)視覺領(lǐng)域最著名的會議叫CVPR,這個PR就是模式識別。你能猜出第一屆CVPR會議是哪年召開的嗎?

2. 機(jī)器學(xué)習(xí):從樣本中學(xué)習(xí)的智能程序

在90年代初,人們開始意識到一種可以更有效地構(gòu)建模式識別算法的方法,那就是用數(shù)據(jù)(可以通過廉價勞動力采集獲得)去替換專家(具有很多圖像方面知識的人)。因此,我們搜集大量的人臉和非人臉圖像,再選擇一個算法,然后沖著咖啡、曬著太陽,等著計算機(jī)完成對這些圖像的學(xué)習(xí)。這就是機(jī)器學(xué)習(xí)的思想。“機(jī)器學(xué)習(xí)”強(qiáng)調(diào)的是,在給計算機(jī)程序(或者機(jī)器)輸入一些數(shù)據(jù)后,它必須做一些事情,那就是學(xué)習(xí)這些數(shù)據(jù),而這個學(xué)習(xí)的步驟是明確的。相信我,就算計算機(jī)完成學(xué)習(xí)要耗上一天的時間,也會比你邀請你的研究伙伴來到你家然后專門手工得為這個任務(wù)設(shè)計一些分類規(guī)則要好。

 


 

圖3 典型的機(jī)器學(xué)習(xí)流程(圖來源于 Natalia Konstantinova 博士的博客)。

在21世紀(jì)中期,機(jī)器學(xué)習(xí)成為了計算機(jī)科學(xué)領(lǐng)域一個重要的研究課題,計算機(jī)科學(xué)家們開始將這些想法應(yīng)用到更大范圍的問題上,不再限于識別字符、識別貓和狗或者識別圖像中的某個目標(biāo)等等這些問題。研究人員開始將機(jī)器學(xué)習(xí)應(yīng)用到機(jī)器人(強(qiáng)化學(xué)習(xí),操控,行動規(guī)劃,抓取)、基因數(shù)據(jù)的分析和金融市場的預(yù)測中。另外,機(jī)器學(xué)習(xí)與圖論的聯(lián)姻也成就了一個新的課題---圖模型。每一個機(jī)器人專家都“無奈地”成為了機(jī)器學(xué)習(xí)專家,同時,機(jī)器學(xué)習(xí)也迅速成為了眾人渴望的必備技能之一。然而,“機(jī)器學(xué)習(xí)”這個概念對底層算法只字未提。我們已經(jīng)看到凸優(yōu)化、核方法、支持向量機(jī)和Boosting算法等都有各自輝煌的時期。再加上一些人工設(shè)計的特征,那在機(jī)器學(xué)習(xí)領(lǐng)域,我們就有了很多的方法,很多不同的思想流派,然而,對于一個新人來說,對特征和算法的選擇依然一頭霧水,沒有清晰的指導(dǎo)原則。但,值得慶幸的是,這一切即將改變……

延伸閱讀:要了解更多關(guān)于計算機(jī)視覺特征的知識,可以看看原作者之前的博客文章:“ 從特征描述子到深度學(xué)習(xí):計算機(jī)視覺的20年 ”。

3. 深度學(xué)習(xí):一統(tǒng)江湖的架構(gòu)

快進(jìn)到今天,我們看到的是一個奪人眼球的技術(shù)---深度學(xué)習(xí)。而在深度學(xué)習(xí)的模型中,受寵愛最多的就是被用在大規(guī)模圖像識別任務(wù)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Nets,CNN),簡稱ConvNets。

 


 

圖4 ConvNet框架(圖來源于 Torch的教程 )

深度學(xué)習(xí)強(qiáng)調(diào)的是你使用的模型(例如深度卷積多層神經(jīng)網(wǎng)絡(luò)),模型中的參數(shù)通過從數(shù)據(jù)中學(xué)習(xí)獲得。然而,深度學(xué)習(xí)也帶來了一些其他需要考慮的問題。因?yàn)槟忝鎸Φ氖且粋€高維的模型(即龐大的網(wǎng)絡(luò)),所以你需要大量的數(shù)據(jù)(大數(shù)據(jù))和強(qiáng)大的運(yùn)算能力(圖形處理器,GPU)才能優(yōu)化這個模型。卷積被廣泛用于深度學(xué)習(xí)(尤其是計算機(jī)視覺應(yīng)用中),而且它的架構(gòu)往往都是非淺層的。

如果你要學(xué)習(xí)Deep Learning,那就得先復(fù)習(xí)下一些線性代數(shù)的基本知識,當(dāng)然了,也得有編程基礎(chǔ)。我強(qiáng)烈推薦Andrej Karpathy的博文:“ 神經(jīng)網(wǎng)絡(luò)的黑客指南 ”。另外,作為學(xué)習(xí)的開端,可以選擇一個不用卷積操作的應(yīng)用問題,然后自己實(shí)現(xiàn)基于CPU的反向傳播算法。

對于深度學(xué)習(xí),還存在很多沒有解決的問題。既沒有完整的關(guān)于深度學(xué)習(xí)有效性的理論,也沒有任何一本能超越機(jī)器學(xué)習(xí)實(shí)戰(zhàn)經(jīng)驗(yàn)的指南或者書。另外,深度學(xué)習(xí)不是萬能的,它有足夠的理由能日益流行,但始終無法接管整個世界。不過,只要你不斷增加你的機(jī)器學(xué)習(xí)技能,你的飯碗無憂。但也不要對深度框架過于崇拜,不要害怕對這些框架進(jìn)行裁剪和調(diào)整,以得到和你的學(xué)習(xí)算法能協(xié)同工作的軟件框架。未來的Linux內(nèi)核也許會在Caffe(一個非常流行的深度學(xué)習(xí)框架)上運(yùn)行,然而,偉大的產(chǎn)品總是需要偉大的愿景、領(lǐng)域的專業(yè)知識、市場的開發(fā),和最重要的:人類的創(chuàng)造力。

其他相關(guān)術(shù)語

1)大數(shù)據(jù)(Big-data):大數(shù)據(jù)是個豐富的概念,例如包含大量數(shù)據(jù)的存儲,數(shù)據(jù)中隱含信息的挖掘等。對企業(yè)經(jīng)營來說,大數(shù)據(jù)往往可以給出一些決策的建議。對機(jī)器學(xué)習(xí)算法而言,它與大數(shù)據(jù)的結(jié)合在早幾年已經(jīng)出現(xiàn)。研究人員甚至任何一個日常開發(fā)人員都可以接觸到云計算、GPU、DevOps和PaaS等等這些服務(wù)。

2)人工智能(Artificial Intelligence):人工智能應(yīng)該是一個最老的術(shù)語了,同時也是最含糊的。它在過去50年里經(jīng)歷了幾度興衰。當(dāng)你遇到一個說自己是做人工智能的人,你可以有兩種選擇:要么擺個嘲笑的表情,要么抽出一張紙,記錄下他所說的一切。

延伸閱讀:原作者2011的博客:“ 計算機(jī)視覺當(dāng)屬人工智能 ”。

結(jié)論

關(guān)于機(jī)器學(xué)習(xí)的討論在此停留(不要單純的認(rèn)為它是深度學(xué)習(xí)、機(jī)器學(xué)習(xí)或者模式識別中的一個,這三者只是強(qiáng)調(diào)的東西有所不同),然而,研究會繼續(xù),探索會繼續(xù)。我們會繼續(xù)構(gòu)建更智能的軟件,我們的算法也將繼續(xù)學(xué)習(xí),但我們只會開始探索那些能真正一統(tǒng)江湖的框架。

如果你也對深度學(xué)習(xí)的實(shí)時視覺應(yīng)用感興趣,特別是那些適合機(jī)器人和家居智能化的應(yīng)用,歡迎來我們的網(wǎng)站 vision.ai 交流。希望未來,我能說的再多一點(diǎn)…

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

拉斯維加斯2025年9月11日 /美通社/ -- 在9月8日至11日舉辦的RE+ 2025展會上,全球綜合儲能解決方案供應(yīng)商德賽電池(Desay Battery)全面展示了其創(chuàng)新成果,并宣布與深圳市華寶新能源股份有限公司...

關(guān)鍵字: 電池 電芯 人工智能 鋰電

AI賦能制造,黃埔匯聚全球新機(jī)遇 廣州2025年9月11日 /美通社/ -- 2025年9月10日,由廣州開發(fā)區(qū)投資集團(tuán)有限公司、廣州開發(fā)區(qū)黃埔區(qū)具身智能機(jī)器人產(chǎn)業(yè)發(fā)展促進(jìn)會、華南美國商會共同主辦的"2025...

關(guān)鍵字: 智能制造 AI 人工智能 供應(yīng)鏈

香港2025年9月11日 /美通社/ -- 華欽科技集團(tuán)(納斯達(dá)克代碼:CLPS,以下簡稱"華欽科技"或"集團(tuán)")近日宣布成功利用人工智能(AI),包括微軟Copilot等客戶指定AI模型,完成對一家香港大型銀行30年歷...

關(guān)鍵字: 人工智能 PS REACT 測試

在科技飛速發(fā)展的當(dāng)下,人工智能與邊緣計算的融合正以前所未有的速度重塑著我們的生活。RK3576芯片擁有4核Cortex-A72以及4核Cortex-A53提供基礎(chǔ)算力,6TOPS算力NPU來模型推導(dǎo)運(yùn)算。使用YOLOv8...

關(guān)鍵字: 人工智能 邊緣計算 YOLOv8模型

廣州2025年9月9日 /美通社/ -- 在2025年柏林國際消費(fèi)電子展(IFA  2025)上,來自中國的清潔能源科技企業(yè),廣州疆??萍加邢薰荆ㄕ魍兀┮云淝把氐?..

關(guān)鍵字: 新能源 消費(fèi)電子展 人工智能 清潔能源

上海2025年9月9日 /美通社/ -- 為全面落實(shí)黨中央、國務(wù)院和上海市委、市政府關(guān)于加快發(fā)展人力資源服務(wù)業(yè)的決策部署,更好發(fā)揮人力資源服務(wù)業(yè)賦能百業(yè)作用,8月29日,以"AI智領(lǐng) HR智鏈 靜候你來&quo...

關(guān)鍵字: 智能體 AI BSP 人工智能

深圳2025年9月9日 /美通社/ -- 2025年9月3日,國際獨(dú)立第三方檢測、檢驗(yàn)和認(rèn)證機(jī)構(gòu)德國萊茵TÜV大中華區(qū)(以下簡稱"TÜV萊茵&q...

關(guān)鍵字: 研討會 汽車行業(yè) ISO 人工智能

9月9日消息,今日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布《中國AI云市場,1H25》報告。

關(guān)鍵字: AI 人工智能

立體深度估計在機(jī)器人技術(shù)、AR/VR和工業(yè)檢測中至關(guān)重要,它為諸如箱體拾取、自動導(dǎo)航和質(zhì)量控制等任務(wù)提供了精確的3D感知。Teledyne IIS的Bumblebee X立體相機(jī)既具備高精度,又能夠提供實(shí)時性能,能夠在1...

關(guān)鍵字: 深度學(xué)習(xí) AR 機(jī)器人

面對市場對更智能產(chǎn)品、更短設(shè)計周期以及更高效靈活生產(chǎn)流程的需求日益增長,設(shè)計與制造企業(yè)紛紛借助人工智能,推動業(yè)務(wù)流程邁向新高度。憑借處理復(fù)雜數(shù)據(jù)的卓越能力與傳遞智能洞見的便捷性,人工智能已準(zhǔn)備好在工業(yè)價值鏈的各個環(huán)節(jié)承擔(dān)...

關(guān)鍵字: 人工智能 工業(yè)物聯(lián)網(wǎng) 傳感器
關(guān)閉