www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當前位置:首頁 > 消費電子 > 消費電子
[導讀]在這一步中,需要從不同的數(shù)據(jù)源收集數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)(例如數(shù)據(jù)庫中的表格數(shù)據(jù))和非結(jié)構(gòu)化數(shù)據(jù)(例如文本、圖像和音頻)。

數(shù)據(jù)收集和預處理:在這一步中,需要從不同的數(shù)據(jù)源收集數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)(例如數(shù)據(jù)庫中的表格數(shù)據(jù))和非結(jié)構(gòu)化數(shù)據(jù)(例如文本、圖像和音頻)。然后需要對數(shù)據(jù)進行預處理,例如數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換和特征提取等操作,以便用于模型訓練。特征工程:在這一步中,需要根據(jù)預處理后的數(shù)據(jù)選擇合適的特征,以便用于模型訓練。特征工程可以包括特征選擇、特征提取、特征轉(zhuǎn)換和特征降維等操作。模型選擇和訓練:在這一步中,需要根據(jù)特定問題的要求選擇合適的模型,并使用已經(jīng)預處理和特征工程的數(shù)據(jù)對其進行訓練。常用的模型包括線性回歸、邏輯回歸、決策樹、支持向量機、神經(jīng)網(wǎng)絡和深度學習模型等。模型評估和調(diào)優(yōu):在模型訓練完成后,需要對模型進行評估和調(diào)優(yōu)。評估模型的常見方法包括精度、召回率、F1 值、ROC 曲線和 AUC 等指標。在評估過程中,還需要進行超參數(shù)調(diào)優(yōu),例如學習率、正則化參數(shù)等,以優(yōu)化模型性能。模型部署:在模型評估和調(diào)優(yōu)后,需要將模型部署到實際環(huán)境中。這包括將模型集成到應用程序中、構(gòu)建 API 接口、進行批量推理或流式推理等。模型監(jiān)控和維護:一旦模型被部署到實際環(huán)境中,需要進行模型監(jiān)控和維護。這包括監(jiān)控模型的性能、更新模型、修復錯誤和改進模型等操作。部署機器學習的過程涉及多個步驟。首先選擇一個模型,針對特定任務加以訓練,用測試數(shù)據(jù)進行驗證,然后,將該模型部署到實際系統(tǒng)中并進行監(jiān)控。在本文中,我們將討論這些步驟,將每個步驟拆分講解來介紹機器學習。

機器學習是指在沒有明確指令的情況下能夠?qū)W習和加以改進的系統(tǒng)。這些系統(tǒng)從數(shù)據(jù)中學習,用于執(zhí)行特定的任務或功能。在某些情況下,學習,或者更具體地說,訓練,是在受監(jiān)督的方式下進行,當輸出不正確時對模型加以調(diào)整,使其生成正確的輸出。在其他情況下,則實行無監(jiān)督學習,由系統(tǒng)負責梳理數(shù)據(jù)來發(fā)現(xiàn)以前未知的模式。大多數(shù)機器學習模型都是遵循這兩種范式(監(jiān)督學習與無監(jiān)督學習)。

現(xiàn)在,讓我們深入研究“模型”的含義,然后探究數(shù)據(jù)如何成為機器學習的燃料。

機器學習模型

模型是機器學習解決方案的抽象化表述。模型定義架構(gòu),架構(gòu)經(jīng)過訓練變成產(chǎn)品實現(xiàn)。所以,我們不是部署模型,而是部署經(jīng)過數(shù)據(jù)訓練的模型的實現(xiàn)(在下一節(jié)中有更加詳細的介紹)。模型 + 數(shù)據(jù) + 訓練=機器學習解決方案的實例(圖1)。

機器學習解決方案代表一個系統(tǒng)。它們接受輸入,在網(wǎng)絡中執(zhí)行不同類型的計算,然后提供輸出。輸入和輸出代表數(shù)值型數(shù)據(jù),這意味著,在某些情況下,需要轉(zhuǎn)譯。例如,將文本數(shù)據(jù)輸入深度學習網(wǎng)絡需要將單詞編碼成數(shù)字形式,考慮到可以使用的單詞的多樣性,該數(shù)字形式通常是高維向量。同樣,輸出可能需要從數(shù)字形式轉(zhuǎn)譯回文本形式。

機器學習模型有多種類型,如神經(jīng)網(wǎng)絡模型、貝葉斯 (Bayesian) 模型、回歸模型、聚類模型等。您選擇的模型是基于著手解決的問題。

對于神經(jīng)網(wǎng)絡來說,模型從淺多層網(wǎng)絡到深度神經(jīng)網(wǎng)絡,類型豐富,而深度神經(jīng)網(wǎng)絡還包括多層特化神經(jīng)元(處理單元)。深度神經(jīng)網(wǎng)絡還有一系列基于目標應用的可用模型。例如:

如果您的應用側(cè)重于識別圖像中的對象,那么卷積神經(jīng)網(wǎng)絡 (CNN) 就是理想的模型。CNN已被應用于皮膚癌檢測,效果優(yōu)于皮膚科醫(yī)生的平均水平。

如果您的應用涉及預測或生成復雜序列(如人類語言句子),那么遞歸神經(jīng)網(wǎng)絡 (RNN) 或長短期記憶網(wǎng)絡 (LSTM) 是理想模型。LSTM也已經(jīng)應用到人類語言的機器翻譯中。

如果您的應用涉及用人類語言描述圖像內(nèi)容,可以使用CNN和LSTM的組合(圖像輸入CNN,CNN的輸出代表LSTM的輸入,后者發(fā)出詞匯序列)。

如果您的應用涉及生成現(xiàn)實圖像(如風景或人臉),那么生成對抗網(wǎng)絡 (GAN) 是當前最先進的模型。

這些模型代表了當今常用的部分深層神經(jīng)網(wǎng)絡架構(gòu)。深度神經(jīng)網(wǎng)絡深受歡迎,因為它們可以接受非結(jié)構(gòu)化數(shù)據(jù),如圖像、視頻或音頻信息。網(wǎng)絡中的各層構(gòu)成一個特征層次結(jié)構(gòu),使它們能夠?qū)Ψ浅碗s的信息進行分類。深度神經(jīng)網(wǎng)絡已經(jīng)在許多問題領(lǐng)域展示出先進的性能。但是像其他機器學習模型一樣,它們的準確性依賴于數(shù)據(jù)。接下來我們就探討一下這個方面。

數(shù)據(jù)和訓練

無論在運算中,還是在通過模型訓練構(gòu)建機器學習解決方案的過程中,數(shù)據(jù)皆為驅(qū)動機器學習的燃料。對于深度神經(jīng)網(wǎng)絡的訓練數(shù)據(jù),探索數(shù)量和質(zhì)量前提下的必要數(shù)據(jù)至關(guān)重要。

深度神經(jīng)網(wǎng)絡需要大量數(shù)據(jù)進行訓練;按經(jīng)驗來說,圖像分類中每類需要1,000張圖像。但具體答案顯然取決于模型的復雜度和容錯度。實際機器學習解決方案中的一些示例表明,數(shù)據(jù)集有各種大小。一個面部檢測和識別系統(tǒng)需要45萬張圖像,一個問答聊天機器人需要接受20萬個問題和200萬個匹配答案的訓練。根據(jù)要解決的問題,有時較小的數(shù)據(jù)集也足夠。一個情感分析解決方案(根據(jù)書面文本確定觀點的極性)只需要數(shù)萬個樣本。

數(shù)據(jù)的質(zhì)量和數(shù)量同等重要。鑒于訓練需要大數(shù)據(jù)集,即使少量的錯誤訓練數(shù)據(jù)也會導致糟糕的解決方案。根據(jù)所需的數(shù)據(jù)類型,數(shù)據(jù)可能會經(jīng)歷一個清洗過程。此過程確保數(shù)據(jù)集一致、沒有重復數(shù)據(jù)且準確、完整(沒有無效或不完整數(shù)據(jù))。有可以支持此過程的工具。驗證數(shù)據(jù)的偏差也很重要,確保數(shù)據(jù)不會導致有偏差的機器學習解決方案。

機器學習訓練對數(shù)值型數(shù)據(jù)進行運算,因此,根據(jù)您的解決方案,可能需要預處理步驟。例如,如果數(shù)據(jù)是人類語言,其必須首先轉(zhuǎn)譯為數(shù)字形式才能處理??梢詫D像進行預處理以保持一致性。例如,除了其他運算外,輸入深度神經(jīng)網(wǎng)絡的圖像還需要調(diào)整大小和平滑處理,以去除噪聲。

機器學習中最大的問題之一是獲取數(shù)據(jù)集來訓練機器學習解決方案。根據(jù)您的具體問題,這個工作量可能非常大,因為可能沒有現(xiàn)成的數(shù)據(jù),需要您另外設(shè)法獲取。

最后,應該分割數(shù)據(jù)集,分別用作訓練數(shù)據(jù)和測試數(shù)據(jù)。訓練數(shù)據(jù)用于訓練模型,在訓練完成后,測試數(shù)據(jù)用于驗證解決方案的準確性(圖2)。

有工具來幫助完成這個過程,大多數(shù)框架都擁有“分割”功能,用于分割訓練和測試數(shù)據(jù)?,F(xiàn)在我們來看一些簡化機器學習解決方案構(gòu)造的框架。

框架

現(xiàn)在,不再需要從頭開始構(gòu)建機器學習模型。您可以使用包含這些模型和其他工具的框架來準備數(shù)據(jù)和驗證您的解決方案。這些框架還提供用于部署解決方案的環(huán)境。選擇哪個框架通常取決于您的熟悉程度,但在剛開始的時候可以選擇一個適合您要使用的應用與模型的框架。

TensorFlow是最好的深度學習框架。它支持所有流行的模型(CNN、RNN、LSTM等),并允許您使用Python或C++進行開發(fā)。從高端服務器到移動設(shè)備,均可部署TensorFlow解決方案。如果您剛剛上手,TensorFlow是一個不錯的起點,它有教程和豐富的文檔。

CAFFE最初是一個學術(shù)項目,但在發(fā)布到開源后,已經(jīng)發(fā)展成為一個流行的深度學習框架。CAFFE采用C++編寫,但也支持Python模型開發(fā)。同TensorFlow一樣,它也支持廣泛的深度學習模型。

PyTorch的框架中。PyTorch是另一個很好的選擇,它基于豐富的可用信息,包括構(gòu)建不同類型解決方案的實踐教程。

R語言和環(huán)境是機器學習和數(shù)據(jù)科學的流行工具。其為交互式工具,可幫助您逐步構(gòu)建解決方案的原型,同時分階段查看結(jié)果。有了Keras(一個開源的神經(jīng)網(wǎng)絡庫),您可以用極少量的開發(fā)投入來構(gòu)建CNN和RNN。

模型審核

一旦模型經(jīng)過訓練并滿足了準確性要求,即可部署到生產(chǎn)系統(tǒng)中。但是到了這一步就需要審核解決方案,以確保其符合要求??紤]到?jīng)Q策是由模型來做以及對人們的影響,這一點尤為重要。

有些機器學習模型是透明的,可以理解(例如,決策樹)。但深度神經(jīng)網(wǎng)絡等其他模型被認為是“黑箱”,決策是由數(shù)百萬個無法用模型本身解釋的計算做出的。因此,過去一度可以接受定期審核,但是,連續(xù)審核正在迅速成為這些暗箱情況下的標配,因為錯誤是不可避免的。一旦發(fā)現(xiàn)錯誤,這些信息可以用作調(diào)整模型的數(shù)據(jù)。

另一個考慮是解決方案的生命周期。模型會衰退,輸入數(shù)據(jù)會發(fā)生變化,從而導致模型性能的變化。因此,必須接受解決方案隨著時間的推移會變得羸弱,機器學習解決方案必須隨著周圍世界的變化而不斷做出改變。

為了部署機器學習解決方案,我們從一個問題開始,然后考慮可能的解決模型。接下來是獲取數(shù)據(jù),經(jīng)過正確清理和分割,就可以使用機器學習框架訓練和驗證模型。并非所有的框架都是相同的,您可以根據(jù)您的模型和經(jīng)驗來選擇和應用。然后,使用該框架部署機器學習解決方案,通過適當?shù)膶徍?,解決方案可以在真實世界中使用實時數(shù)據(jù)進行運算。

今天的人工智能,其實是把現(xiàn)實生活中的問題量化成了可計算的問題,然后用計算機算出來。數(shù)學模型則架起了中間的橋梁。

現(xiàn)實生活中,很多問題都可以通過建模解決。比如計算遠程火炮彈道問題,計算日食、月食出現(xiàn)的時間和地點等。我們只要把相應公式用計算機語言寫一遍,再代入?yún)?shù),就能計算出來。

然而,更多問題的解決方法是不確定的。即使我們找到了相應的數(shù)學模型,也不知道應該代入什么參數(shù)。比如語音識別、人臉識別和機器翻譯等。因此,我們需要讓計算機通過自主學習,從大量數(shù)據(jù)中得到相應參數(shù)。這個過程,就是機器學習。

機器學習旨在發(fā)現(xiàn)數(shù)據(jù)存在和利用的模式,并用它們進行學習及做出預測。機器學習的過程,就是用計算機算法不斷地優(yōu)化模型,讓它越來越接近真實情況的過程。它與人類學習的道理如出一轍。

考察人的學習通常方式是考試,如果分數(shù)不及格,就需要進一步學習。機器學習也要這樣來衡量,它的目標用專業(yè)術(shù)語來說,就是“期望值最大化”。

機器學習的效果取決于兩個方面:一方面是學習的深度。機器學習并不能“一口吃成個胖子”,它的訓練算法需要迭代執(zhí)行。這如同人在學習時要通過復習來“溫故而知新”一樣。機器學習迭代的次數(shù)越多,即學習得越深入,得到的數(shù)學模型效果越好。另一方面是數(shù)據(jù)的質(zhì)與量。正如我們做大量優(yōu)質(zhì)習題,成績就會提高。機器學習也是如此,訓練數(shù)據(jù)量越大,學習效果就會越好。

根據(jù)數(shù)學模型的特點,機器學習有兩種方法:一種是利用已知模型進行訓練;另一種是在模型未知的情況下,設(shè)計一些簡單通用的模型結(jié)構(gòu),然后使用大量的數(shù)據(jù)進行訓練,訓練成什么樣就是什么樣。這便是我們常聽到的人工智能“黑箱”問題,即使訓練有效,也不清楚里面是什么。

深度學習就是后一種機器學習的方法。人工智能涵蓋的領(lǐng)域十分廣泛,深度學習只是其中的一個分支,屬于機器學習的范疇。人工智能需要有“獨立思考”能力與機器學習技術(shù)的支持,深度學習便是幫助機器實現(xiàn)“獨立思考”的一種方式。

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動電源

在工業(yè)自動化蓬勃發(fā)展的當下,工業(yè)電機作為核心動力設(shè)備,其驅(qū)動電源的性能直接關(guān)系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動勢抑制與過流保護是驅(qū)動電源設(shè)計中至關(guān)重要的兩個環(huán)節(jié),集成化方案的設(shè)計成為提升電機驅(qū)動性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機 驅(qū)動電源

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個照明設(shè)備的使用壽命。然而,在實際應用中,LED 驅(qū)動電源易損壞的問題卻十分常見,不僅增加了維護成本,還影響了用戶體驗。要解決這一問題,需從設(shè)計、生...

關(guān)鍵字: 驅(qū)動電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動電源的公式,電感內(nèi)電流波動大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計 驅(qū)動電源

電動汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機驅(qū)動控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機驅(qū)動系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字: 電動汽車 新能源 驅(qū)動電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進步,高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動電源 LED

LED通用照明設(shè)計工程師會遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅(qū)動電源

關(guān)鍵字: LED 驅(qū)動電源 開關(guān)電源

LED驅(qū)動電源是把電源供應轉(zhuǎn)換為特定的電壓電流以驅(qū)動LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動電源
關(guān)閉