機器學習包含哪些分類?大數(shù)據(jù)環(huán)境下機器學習的現(xiàn)狀如何?
在下述的內(nèi)容中,小編將會對機器學習的相關消息予以報道,如果機器學習是您想要了解的焦點之一,不妨和小編共同閱讀這篇文章哦。
一、大數(shù)據(jù)環(huán)境下機器學習的研究現(xiàn)狀
大數(shù)據(jù)的價值體現(xiàn)主要集中在數(shù)據(jù)的轉(zhuǎn)向以及數(shù)據(jù)的信息處理能力等等。在產(chǎn)業(yè)發(fā)展的今天,大數(shù)據(jù)時代的到來,對數(shù)據(jù)的轉(zhuǎn)換,數(shù)據(jù)的處理數(shù)據(jù)的存儲等帶來了更好的技術支持,產(chǎn)業(yè)升級和新產(chǎn)業(yè)誕生形成了一種推動力量,讓大數(shù)據(jù)能夠針對可發(fā)現(xiàn)事物的程序進行自動規(guī)劃,實現(xiàn)人類用戶以計算機信息之間的協(xié)調(diào)。另外現(xiàn)有的許多機器學習方法是建立在內(nèi)存理論基礎上的。大數(shù)據(jù)還無法裝載進計算機內(nèi)存的情況下,是無法進行諸多算法的處理的,因此應提出新的機器學習算法,以適應大數(shù)據(jù)處理的需要。大數(shù)據(jù)環(huán)境下的機器學習算法,依據(jù)一定的性能標準,對學習結果的重要程度可以予以忽視。采用分布式和并行計算的方式進行分治策略的實施,可以規(guī)避掉噪音數(shù)據(jù)和冗余帶來的干擾,降低存儲耗費,同時提高學習算法的運行效率。 [4]
隨著大數(shù)據(jù)時代各行業(yè)對數(shù)據(jù)分析需求的持續(xù)增加,通過機器學習高效地獲取知識,已逐漸成為當今機器學習技術發(fā)展的主要推動力。大數(shù)據(jù)時代的機器學習更強調(diào)“學習本身是手段"機器學習成為一種支持和服務技術。如何基于機器學習對復雜多樣的數(shù)據(jù)進行深層次的分析,更高效地利用信息成為當前大數(shù)據(jù)環(huán)境下機器學習研究的主要方向。所以,機器學習越來越朝著智能數(shù)據(jù)分析的方向發(fā)展,并已成為智能數(shù)據(jù)分析技術的一個重要源泉。另外,在大數(shù)據(jù)時代,隨著數(shù)據(jù)產(chǎn)生速度的持續(xù)加快,數(shù)據(jù)的體量有了前所未有的增長,而需要分析的新的數(shù)據(jù)種類也在不斷涌現(xiàn),如文本的理解、文本情感的分析、圖像的檢索和理解、圖形和網(wǎng)絡數(shù)據(jù)的分析等。使得大數(shù)據(jù)機器學習和數(shù)據(jù)挖掘等智能計算技術在大數(shù)據(jù)智能化分析處理應用中具有極其重要的作用。在2014年12月中國計算機學會(CCF)大數(shù)據(jù)專家委員會上通過數(shù)百位大數(shù)據(jù)相關領域?qū)W者和技術專家投票推選出的“2015年大數(shù)據(jù)十大熱點技術與發(fā)展趨勢”中,結合機器學習等智能計算技術的大數(shù)據(jù)分析技術被推選為大數(shù)據(jù)領域第一大研究熱點和發(fā)展趨勢。
二、機器學習分類
機器學習經(jīng)過幾十年的發(fā)展,衍生出了很多種分類方法,這里按學習模式的不同,可分為監(jiān)督學習、半監(jiān)督學習、無監(jiān)督學習和強化學習。
(一)監(jiān)督學習
監(jiān)督學習(Supervised Learning)是從有標簽的訓練數(shù)據(jù)中學習模型,然后對某個給定的新數(shù)據(jù)利用模型預測它的標簽。如果分類標簽精確度越高,則學習模型準確度越高,預測結果越精確。
監(jiān)督學習主要用于回歸和分類。
常見的監(jiān)督學習的回歸算法有線性回歸、回歸樹、K鄰近、Adaboost、神經(jīng)網(wǎng)絡等。
常見的監(jiān)督學習的分類算法有樸素貝葉斯、決策樹、SVM、邏輯回歸、K鄰近、Adaboost、神經(jīng)網(wǎng)絡等。
(二)半監(jiān)督學習
半監(jiān)督學習(Semi-Supervised Learning)是利用少量標注數(shù)據(jù)和大量無標注數(shù)據(jù)進行學習的模式。
半監(jiān)督學習側(cè)重于在有監(jiān)督的分類算法中加入無標記樣本來實現(xiàn)半監(jiān)督分類。
常見的半監(jiān)督學習算法有Pseudo-Label、Π-Model、Temporal Ensembling、Mean Teacher、VAT、UDA、MixMatch、ReMixMatch、FixMatch等。
(三)無監(jiān)督學習
無監(jiān)督學習(Unsupervised Learning)是從未標注數(shù)據(jù)中尋找隱含結構的過程。
無監(jiān)督學習主要用于關聯(lián)分析、聚類和降維。
常見的無監(jiān)督學習算法有稀疏自編碼(Sparse Auto-Encoder)、主成分分析(Principal Component Analysis, PCA)、K-Means算法(K均值算法)、DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise)、最大期望算法(Expectation-Maximization algorithm, EM)等。
(四)強化學習
強化學習(Reinforcement Learning)類似于監(jiān)督學習,但未使用樣本數(shù)據(jù)進行訓練,是是通過不斷試錯進行學習的模式。
在強化學習中,有兩個可以進行交互的對象:智能體(Agnet)和環(huán)境(Environment),還有四個核心要素:策略(Policy)、回報函數(shù)(收益信號,Reward Function)、價值函數(shù)(Value Function)和環(huán)境模型(Environment Model),其中環(huán)境模型是可選的。
強化學習常用于機器人避障、棋牌類游戲、廣告和推薦等應用場景中。
以上便是小編此次帶來的全部內(nèi)容,十分感謝大家的耐心閱讀,想要了解更多相關內(nèi)容,或者更多精彩內(nèi)容,請一定關注我們網(wǎng)站哦。