軟件定義汽車 ( SDV ) 是指汽車設(shè)計的一種新范式,其中車輛的功能和特性主要由軟件而不是傳統(tǒng)的硬件組件定義和控制。
在 SDV 中,軟件更新可以動態(tài)改變和增強車輛功能,從而形成更加靈活、適應(yīng)性更強的汽車生態(tài)系統(tǒng)。
軟件定義汽車中的 MLOP
MLOps(機器學(xué)習(xí)操作)涵蓋旨在簡化和自動化生產(chǎn)環(huán)境中機器學(xué)習(xí)模型整個生命周期的管理和部署的實踐、工具和方法。
與 SDV 的相關(guān)性
SDV 嚴(yán)重依賴 ML 模型來執(zhí)行關(guān)鍵功能,例如自動駕駛、預(yù)測性維護、用戶個性化等。
這些模型的有效管理不僅重要,而且對于維持 SDV 的車輛性能、安全性和可靠性至關(guān)重要。
MLOPs 平臺、不同方法以及如何實現(xiàn)?
我們將研究 ML 平臺的范圍、構(gòu)建平臺的方法以及如何使用討論的方法之一來構(gòu)建平臺。
MLOPs 平臺
一個整體的軟件平臺,可提高運輸、監(jiān)控和管理 ML 模型生命周期的生產(chǎn)力和可擴展性,從而促進 SDV 內(nèi)的功能。
集中式與分散式
MLOP 平臺可以集中化,在一個中心位置管理所有有助于促進功能的 ML 模型。
它還可以由各個功能團隊進行分離和構(gòu)建,并縮小管理范圍,僅管理與該功能相關(guān)的模型。
我們將深入研究用于管理 ML 模型的集中式 ML 平臺以及構(gòu)建該平臺所需的條件。
為 SDV 構(gòu)建整體 ML 平臺需要什么
我們需要考慮以下組件來構(gòu)建一個集中式 ML 平臺,有效管理有助于 SDV 內(nèi)的功能的 ML 模型。
數(shù)據(jù)工程
組織傾向于在企業(yè)級建立團隊來幫助管理訓(xùn)練和開發(fā)機器學(xué)習(xí)模型的數(shù)據(jù)需求。
ML 平臺應(yīng)具有完善的實用程序來跟蹤訓(xùn)練 ML 模型所需的數(shù)據(jù)沿襲,例如數(shù)據(jù)提取、數(shù)據(jù)轉(zhuǎn)換和用于訓(xùn)練當(dāng)前模型的最終數(shù)據(jù)集。良好跟蹤的數(shù)據(jù)沿襲可以幫助使用該平臺的功能團隊深入了解用于訓(xùn)練模型的數(shù)據(jù)點,從而改進模型以有效地幫助該功能。
通常的做法是采用 API 優(yōu)先的方法將企業(yè)級數(shù)據(jù)管理團隊集成到平臺中。
模型開發(fā)
盡管平臺無法控制模型的開發(fā)方式,因為功能團隊將負(fù)責(zé)協(xié)調(diào)該方面,但平臺的最佳利益是向功能團隊提供標(biāo)準(zhǔn)化的方法/模板,以收集以下筆記本源跟蹤、訓(xùn)練集 id、驗證集 id、測試集 id、預(yù)處理 id、后處理 id、模型 id 和生成的模型版本作為實驗、設(shè)備類型和模型創(chuàng)建 id 的一部分。
該平臺還可以標(biāo)準(zhǔn)化模型開發(fā)時所需的工件,以便稍后在模型部署期間使用。
從模型開發(fā)的角度收集上述所有信息在模型管理/監(jiān)控階段非常有用。
模型驗證/治理
一旦模型開發(fā)完畢、測試完畢并準(zhǔn)備部署到車輛上,MLOPs 平臺應(yīng)該提供一個接口來驗證它,然后才能通過部署所需的框架/實用程序發(fā)布它。
在將模型部署到車輛之前,適當(dāng)?shù)幕趯徟ぷ髁鞯闹卫砟P蛯τ趯彶樵撃P椭陵P(guān)重要。
如果模型在部署前經(jīng)過治理流程,這對 ML 平臺來說非常有利。它還為組織內(nèi)部處理模型建立了標(biāo)準(zhǔn)。
模型部署
這是平臺的核心;這是輪胎與道路接觸的地方。所有上述步驟構(gòu)建并設(shè)置了平臺,使其處于一個非凡的位置,可以輕松處理模型。
前面步驟中采用的標(biāo)準(zhǔn)化技術(shù)將對所有模型進行水平設(shè)置,并有助于減少差異性,同時開發(fā)服務(wù)將模型納入平臺并使用各種實用程序和框架將它們部署到車輛上以部署軟件。
該平臺應(yīng)能夠提取、跟蹤和管理已上傳的部署模型,并輕松與車輛部署實用程序和框架集成。同樣,在這種情況下,API 優(yōu)先方法是首選方法。
模范 OP
一旦模型上傳部署,就可以在對其執(zhí)行操作時應(yīng)用幾件事。
如果部分上傳導(dǎo)致平臺無法處理模型,平臺應(yīng)該能夠檢測到它們并進行相應(yīng)的處理。
如果模型上傳后未能通過驗證/治理過程,平臺應(yīng)該能夠處理這個問題。
模型已上傳并準(zhǔn)備部署。在這種情況下,平臺應(yīng)該能夠評估模型在車輛中運行所需的軟件,并根據(jù)軟件準(zhǔn)備情況、版本兼容性和其他此類因素做出相應(yīng)的決策。
如果模型通過了上述所有標(biāo)準(zhǔn)并被部署,則平臺應(yīng)該能夠?qū)⑵湟苿拥揭烟幚淼哪P吞卣鳎詮哪P偷牟渴鸷臀磥聿僮髦惺占嘁娊狻?
模型監(jiān)控
當(dāng) ML 模型部署到車輛上時,應(yīng)該特別強調(diào)模型監(jiān)控,因為這對于它們的正常運行非常重要。
該平臺應(yīng)開發(fā)實用程序,幫助計算使用 ML 平臺部署的每個模型的數(shù)據(jù)/概念漂移??梢酝ㄟ^開發(fā)一個框架來計算漂移,該框架使用匯總的車輛報告并定期將其與與模型相關(guān)的閾值分?jǐn)?shù)進行比較。
如果不滿足閾值標(biāo)準(zhǔn),則會向模型/特征所有者發(fā)送通知。
重新訓(xùn)練/回滾/雜項功能
模型 OP 和監(jiān)控有助于為功能團隊提供儀表板和視圖,以便他們可以就模型再訓(xùn)練、模型回滾以及與在車輛內(nèi)操作模型相關(guān)的其他幾個功能做出決策。
該平臺應(yīng)該能夠處理可能發(fā)生的各種情況,例如,維護平臺中的版本數(shù)量,以便能夠在需要時輕松獲取適當(dāng)?shù)陌姹?如果新部署的版本出現(xiàn)意外的性能損失,則回滾到以前執(zhí)行的模型版本;影子部署關(guān)鍵功能的較新版本;將模型部署到預(yù)定義的車輛子集而不是整個車隊。
集中式 MLOP 平臺對 SDV 的優(yōu)勢
從上述方法可以看出,MLOPs平臺通過標(biāo)準(zhǔn)化將模型部署到車輛軟件所需的MLOPs功能,有助于加快價值實現(xiàn)時間,從而提高整體效率。
以下是此方法的優(yōu)點的概述
· 幫助構(gòu)建可重復(fù)使用的工作流程/管道
· 提高功能/產(chǎn)品團隊之間的一致性和生產(chǎn)力
· 為與 ML 模型相關(guān)的所有 ML 相關(guān)功能/操作提供一個中心位置。
· 降低車輛集成障礙和所需的專業(yè)知識。
構(gòu)建一個用于管理與軟件定義汽車相關(guān)的 ML 模型的尖端 ML 平臺還有許多其他優(yōu)勢。
本文有助于啟動有關(guān) SDV 的思考過程以及模型管理如何對其成功至關(guān)重要。