本科生如何自學(xué)機(jī)器學(xué)習(xí)?
作者:Frank Tian
https://www.zhihu.com/question/332726203/answer/737596538
入門
首先,你要知道什么是機(jī)器學(xué)習(xí)。
這里我推薦Andrew Ng的機(jī)器學(xué)習(xí)教程,比較適合新手和來自工業(yè)界對數(shù)學(xué)要求不是很高的同學(xué)。
這門課適合剛上大學(xué)的萌新們。
https://www.bilibili.com/video/av50747658
它有19個小時,我看完它用了將近兩個月,我建議你也不要看的太急。
當(dāng)看完這些教程之后,你就對機(jī)器學(xué)習(xí)有了清晰的認(rèn)知。
https://www.bilibili.com/video/av49445369
這門課同樣不難,不需要高深的數(shù)學(xué)知識,同樣是為新手們準(zhǔn)備的。
深度學(xué)習(xí)的內(nèi)容稍多,Andrew帶你粗略的了解了AI的一些方面,一共25個小時,我看完它花了三個月。
在期間我去實(shí)踐了他提到的各種優(yōu)化方法和技巧,閱讀了CV和NLP領(lǐng)域他提到的論文,并且找到輪子跑了跑。
我認(rèn)為,深度學(xué)習(xí)的學(xué)習(xí)更重要的是實(shí)踐。
進(jìn)階
接下來,你可以嘗試讀一些有公式推導(dǎo)的專業(yè)書籍了。
前提是你已經(jīng)了解了線性代數(shù),微積分和概率論的知識,當(dāng)然,作為計算機(jī)系的同學(xué),你一定掌握了離散數(shù)學(xué)。
我推薦《統(tǒng)計學(xué)習(xí)方法》,它適合接受能力正常的同學(xué)。
https://book.douban.com/subject/10590856/
因?yàn)槲沂墙佑|機(jī)器學(xué)習(xí)很久后才接觸到這本書的,因此我讀的很快,沒有印象到底讀了多久。總之這本書比較平易近人。
https://book.douban.com/subject/26708119/
這本書的覆蓋范圍非常廣,適合打算進(jìn)一步深入這個領(lǐng)域的同學(xué)。
這本書是我機(jī)器學(xué)習(xí)的入門書籍,又愛又恨。
看這本書的同時你可能會感到數(shù)學(xué)基礎(chǔ)不夠,十分歡迎你補(bǔ)課凸優(yōu)化。
https://book.douban.com/subject/21249088/
https://www.bilibili.com/video/av40868517
李宏毅老師非常幽默風(fēng)趣,上他的課是十分快樂的事情。
https://www.bilibili.com/video/av10590361
https://www.bilibili.com/video/av9770302
我真得真得非常喜歡他講的課,同時我認(rèn)為你看完這些課之后會對機(jī)器學(xué)習(xí)(主要是深度學(xué)習(xí)部分,對,他幾乎不怎么講統(tǒng)計學(xué)習(xí))有更深的認(rèn)識。
這三個視頻分別是31,40,11個小時,我看完花了相當(dāng)長的時間,如果你已經(jīng)有一些接觸但是擔(dān)心他哪里講的太好沒聽到可惜,那么可以先瀏覽他的slides,slides做的也非常棒!
因?yàn)檫@本書開源了,我直接給你pdf:https://urlify.cn/JZFBJv
這本書是強(qiáng)化學(xué)習(xí)領(lǐng)域非常非常經(jīng)典的教材,但是這本書寫的太磨嘰了!
不過我也沒有其他備選項(xiàng),如果有讀過其他強(qiáng)化學(xué)習(xí)教材,感覺不錯的,歡迎補(bǔ)充。
深入
接下來該深入了解機(jī)器學(xué)習(xí)了,到了這個階段,你也不是大家口中的小白了。
統(tǒng)計學(xué)習(xí)方面,我推薦Pattern Recognition and Machine Learning
https://book.douban.com/subject/2061116/
這本書詳細(xì)的介紹了頻率派和貝葉斯派的思想,讀這本書的時候你會有一種恍然大悟的感覺。
注意網(wǎng)上的版本可能會有錯誤,參考這本書的勘誤。https://urlify.cn/ER7zie
https://book.douban.com/subject/26883982/
https://book.douban.com/subject/4007200/
它和前面那本Reinforcement Learning: An introduction一樣,非常全面,但缺點(diǎn)是太啰嗦了,英文版1200+頁,我沒讀完。
https://book.douban.com/subject/3294335/
https://book.douban.com/subject/1789534/
https://book.douban.com/subject/10758624/
可以看到,這些書的側(cè)重點(diǎn)都不同,這也是為什么我打算都讀一遍它們。
當(dāng)然,如何找到合適的論文,這類問題在知乎已經(jīng)有非常詳細(xì)的回答了。同時,知乎也是一個學(xué)習(xí)機(jī)器學(xué)習(xí)的好地方,這里有很多知識淵博的答主,他們在我剛?cè)腴T的時候給了我非常大的幫助。
https://www.zhihu.com/question/332726203/answer/734365629
2.數(shù)學(xué)基礎(chǔ)。有些人覺得現(xiàn)在搞深度學(xué)習(xí)不需要啥數(shù)學(xué)基礎(chǔ),但那樣只會淪為低級的調(diào)包俠,不能成長為一名合格的煉丹術(shù)士。機(jī)器學(xué)習(xí)(包括深度學(xué)習(xí))需要的數(shù)學(xué)基礎(chǔ)包括:微積分(熟練掌握),凸優(yōu)化(熟練掌握),矩陣論(熟練掌握其中矩陣運(yùn)算,各種分解等,并理解其含義),泛函分析(理解,如果不做相關(guān)內(nèi)容,看著不眼生即可),高等概率論(理解,常用概率公式和概率定理)。數(shù)學(xué)不要光看,要聯(lián)系機(jī)器學(xué)習(xí)當(dāng)中的實(shí)際應(yīng)用一起理解。
3.編程基礎(chǔ)。常用的有python,MATLAB,C/C++等,理論上C/C++學(xué)好了,其他語言掌握特性和擴(kuò)展包即可。
4.如何深入。找個靠譜的老師!找個靠譜的老師!找個靠譜的老師!翻到你們學(xué)院老師主頁,如有文章發(fā)表在NIPS,ACL,CVPR,ICLR,ICML等會議上,說明學(xué)術(shù)水平非常不錯。然后打聽其人品,人品可以,就聯(lián)系跟著做。靠譜的老師會直接帶你走入到一個細(xì)分領(lǐng)域的最前沿,節(jié)省大量的搜索時間。
https://www.zhihu.com/question/332726203/answer/756804600
推薦個我們學(xué)校的課程:https://urlify.cn/JJVv6v
在syllabus那一欄下面有所有的課件。我覺得Kilian是個很好的教授,講得非常清楚。(雖然我不怎么去上課。。)他的課件也是循序漸進(jìn)挺有條理的。我感覺機(jī)器學(xué)習(xí)的傳統(tǒng)方法其實(shí)都是統(tǒng)計的各種運(yùn)用。。所以如果題主統(tǒng)計學(xué)得好的話其實(shí)看起來應(yīng)該沒有什么問題。在知道各種傳統(tǒng)模型背后的原理之后其實(shí)就可以去調(diào)參娛樂了。推薦再學(xué)個python,現(xiàn)在感覺python已經(jīng)占領(lǐng)了機(jī)器學(xué)習(xí)領(lǐng)域。。
如果題主追求分析模型的能力,比如說分析一個SVM的最大error margin是多少這種東西,就屬于master level的課程了。類似于machine learning theory這種課。我能力有限無法做出評價。
課程后半段會討論深度學(xué)習(xí)的概念,這個學(xué)起來的感覺和傳統(tǒng)模型差別很大,挺魔性的。我覺得作為本科生題主只要能在不同場景下知道運(yùn)用什么魔性,大概怎么調(diào)參,就可以了。如果以后還對這個領(lǐng)域感興趣的話可以讀研讀博深造。如果你想要練手的項(xiàng)目之類的我也可以試著去翻翻以前的作業(yè)。。
https://www.zhihu.com/question/332726203/answer/110691656
https://www.zhihu.com/question/332726203/answer/760396018
準(zhǔn)備
循序漸進(jìn)
練手
https://www.zhihu.com/question/332726203/answer/737205846
-END-
猜你喜歡(點(diǎn)擊下劃線即可跳轉(zhuǎn)閱讀
我腦洞大開,讓機(jī)器人來給我剪頭發(fā) 有一個懂機(jī)械、懂焊接、懂電子的爹是什么概念。。。
C++ 基礎(chǔ)知識!初學(xué)者必看!
酷!GitHub開發(fā)者自研火星車,開發(fā)教程全面開源
?最 后?? ?若覺得文章不錯,轉(zhuǎn)發(fā)分享,也是我們繼續(xù)更新的動力。 5T資源大放送!包括但不限于:C/C++,Linux,Python,Java,PHP,人工智能,PCB、FPGA、DSP、labview、單片機(jī)、等等! 在公眾號內(nèi)回復(fù)「 更多資源 」,即可免費(fèi)獲取,期待你的關(guān)注~ 長按識別圖中二維碼關(guān)注
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點(diǎn),不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!