智能駕駛需要怎樣的一條安全帶
“更好的數(shù)據(jù)意味著更好的決策”。這句話如今被越來越多智能駕駛領(lǐng)域人士提及和認可。
讓汽車具備“智慧”,智能駕駛成為全球許多國家都在關(guān)注的一個重要課題。而在這一過程中,AI數(shù)據(jù)對于汽車智能駕駛而言至關(guān)重要,它是汽車變得更“聰明”的關(guān)鍵。
然而,關(guān)于智能駕駛引發(fā)的事故我們也已經(jīng)看到太多,這些教訓也在告誡我們,我們需要更加安全的智能駕駛,需要更多精準的數(shù)據(jù)為安全保駕護航,能夠在汽車感知、規(guī)劃、決策、控制方面進行指揮,才是真正的人工智能。
在汽車智能駕駛的過程中,汽車本身需要具備感知、策劃、決策、控制等一些列能力,而數(shù)據(jù)則是培養(yǎng)智能駕駛AI能力的重要因素,數(shù)據(jù)標注存在的意義是讓機器理解并認識世界,想要讓汽車本身的算法做到處理更多、更復雜的場景,背后就需要有海量的真實道路場景數(shù)據(jù)做支撐。
算力、算法方興未艾:高質(zhì)量數(shù)據(jù)成產(chǎn)業(yè)落地著力點
數(shù)據(jù)、算力、算法是推動人工智能技術(shù)進步的“三駕馬車”。如今,在計算機視覺、語音識別領(lǐng)域,AI的商業(yè)化落地突破并不明顯,原因就在于算法算力的技術(shù)瓶頸。
從宏觀角度來看,現(xiàn)有算法、算力無法準確處理復雜環(huán)境下無限可能的長尾場景,這時候AI數(shù)據(jù)的覆蓋就顯得更加重要。
我們看到,在現(xiàn)有的算法算力的基礎上,越來越多的AI進化方式是通過對大量的原始數(shù)據(jù)進行框選、提取、分類,從而將復雜的原始數(shù)據(jù)標簽化,轉(zhuǎn)為機器學習可以識別的精準數(shù)據(jù),以提升AI的感知能力。
對于智能駕駛技術(shù)而言,這樣的數(shù)據(jù)精確化顯得更為重要:一方面,現(xiàn)實交通場景復雜、安全威脅多,非常重視數(shù)據(jù)分析的效率和敏捷。尤其是國內(nèi)路況的復雜性和國內(nèi)智能駕駛起步稍晚的現(xiàn)狀,更需要高質(zhì)、更精準的數(shù)據(jù)來進行算法訓練。
從安全性上來看,標注數(shù)據(jù)質(zhì)量的高低將直接影響智能駕駛的安全性。例如,人像、建筑物、植物、道路、交通標志、車輛等數(shù)據(jù)標注的準確性直接決定智能駕駛AI對于路況的判斷,數(shù)據(jù)標注偏差或者完成度不高會直接影響行駛安全。
2017年5月17日,美國加利福尼亞州一名車主在開啟了智能駕駛狀態(tài)下撞上前方轉(zhuǎn)彎的卡車不幸身亡。原因是智能駕駛系統(tǒng)沒有辨別出前方白色車輛和天空的區(qū)別,沒有識別出障礙物導致智能剎車沒有及時制動引發(fā)的事故。
從體驗上,首先安全性的保證本身就是最佳的體驗,精準的數(shù)據(jù)是確保AI智能駕駛落地的重要前提。兼?zhèn)鋽?shù)量與質(zhì)量的標注數(shù)據(jù)可以很大程度上提升汽車智能駕駛的安全性與實用性,如何解決數(shù)據(jù)質(zhì)量問題,規(guī)避數(shù)據(jù)錯誤、保障數(shù)據(jù)質(zhì)量已經(jīng)成為智能駕駛領(lǐng)域發(fā)展的頭等大事。
“當下,人工智能正加速往應用人工智能方向發(fā)展,在算法、算力沒有重大突破的前提下,質(zhì)量高和安全性強的數(shù)據(jù)成為人工智能商業(yè)化落地的關(guān)鍵點?!?u>Testin云測CTO陳冠誠在接受媒體采訪時表示。
從產(chǎn)業(yè)的角度來看,智能駕駛的產(chǎn)業(yè)化落地將成為高精度數(shù)據(jù)標注行業(yè)未來發(fā)展方向的一個重要縮影,高質(zhì)量數(shù)據(jù)在促使自動駕駛產(chǎn)業(yè)化落地的同時,也成為數(shù)據(jù)產(chǎn)業(yè)商業(yè)化程度不斷深入的著力點。
云測數(shù)據(jù)優(yōu)勢:專業(yè)定制、獨立安全,方能有的放矢
數(shù)據(jù)是整個人工智能行業(yè)的燃料,數(shù)據(jù)在智能駕駛領(lǐng)域的重要性不容置疑。絕大部分智能駕駛企業(yè)對數(shù)據(jù)也非常重視,但現(xiàn)實情況是缺乏獲得大量且高質(zhì)量數(shù)據(jù)的渠道。
據(jù)2018年智研發(fā)布的《2019-2025年中國數(shù)據(jù)標注與審核行業(yè)市場專項分析研究及投資前景預測報告》顯示,近幾年,數(shù)據(jù)標注與審核行業(yè)快速發(fā)展,2018年市場規(guī)模已達到52.55億元,阿里、騰訊、百度等多家互聯(lián)網(wǎng)巨頭都擁有海量的數(shù)據(jù)標注需求。
實際上,數(shù)據(jù)標注是一個簡單又困難的事情,一方面,在執(zhí)行上的難度相對算法開放要低得多,但另一方面數(shù)據(jù)標注本質(zhì)上是要獲得更準確,更精細化的數(shù)據(jù)結(jié)果,而場景數(shù)據(jù)缺失、數(shù)據(jù)質(zhì)量良莠不齊,以及隱私安全問題成為數(shù)據(jù)行業(yè)面臨的三大痛點。
為解決這些行業(yè)性問題,國內(nèi)AI數(shù)據(jù)服務頭部企業(yè)云測數(shù)據(jù),通過提供定制化的場景化數(shù)據(jù),來滿足業(yè)內(nèi)高標準的數(shù)據(jù)需求。
以云測數(shù)據(jù)的場景化為例,為了滿足智能駕駛領(lǐng)域不同場景的特殊需求,云測數(shù)據(jù)搭建了自己的場景實驗室,為各種智能駕駛細分場景模擬無噪的專屬數(shù)據(jù),通過定制化數(shù)據(jù)采集直擊特定場景化下的數(shù)據(jù)缺失、質(zhì)量良莠不齊等行業(yè)問題。一方面,在場景下的定制化數(shù)據(jù)采集更加精準、數(shù)據(jù)質(zhì)量更高,另一方面,定制化的數(shù)據(jù)集也與智能駕駛需求端的匹配度更高,從而最大化將數(shù)據(jù)轉(zhuǎn)化為生產(chǎn)力。
對于智能駕駛來講,無噪的專屬數(shù)據(jù)采集完成后,數(shù)據(jù)通過標注后或者說加上標簽才有意義,才能用于算法的學習和訓練,最終智能駕駛的應用落地。
當前的自動駕駛所需數(shù)據(jù)需求,正向著多模態(tài)的方向發(fā)展。所謂多模態(tài),即是對多維時間、空間、環(huán)境數(shù)據(jù)的感知與融合。比如當前的自動駕駛需要雷達+攝像頭才能跑的更穩(wěn),相對應的,就需要2D/3D融合標注工具。
在標注工具方面,云測數(shù)據(jù)自研了一套可以支持圖片、語音、文本等多品類的標注平臺,其中的三維標注工具,尤其是3D點云的標注工具,對雷達成像的圖像中的機動車、障礙物、行人等多目標進行3D標注,并通過渲染引擎的優(yōu)化,來保證整個過程的流暢和快捷,在數(shù)據(jù)質(zhì)量的導向下實現(xiàn)更優(yōu)的品控和更快的數(shù)據(jù)交付,當屬業(yè)內(nèi)領(lǐng)先。對此,數(shù)據(jù)數(shù)據(jù)總經(jīng)理賈宇航表示,“我們希望通過精準高質(zhì)、獨立安全的數(shù)據(jù)幫助智能駕駛客戶快速構(gòu)建核心數(shù)據(jù)壁壘?!?/p>
值得一提的是,智能駕駛客戶在選擇數(shù)據(jù)供應商時,獨立第三方數(shù)據(jù)標注公司更具優(yōu)勢。
某業(yè)內(nèi)人士在接受采訪時表示“考慮到大廠能也有自動駕駛的團隊或業(yè)務,難免會擔心自家數(shù)據(jù)被拿去訓練別人的模型;再加上要價不菲,所以合作并不多。如果跟第三方數(shù)據(jù)標注公司合作,就不用擔憂這種問題。他們要價合理,而且既不會把數(shù)據(jù)外泄,也不會自用?!?/p>
目前云測數(shù)據(jù)在華東、華北、華南設有數(shù)據(jù)標注基地,還有幾個基地在部署中,并擁有行業(yè)內(nèi)最大規(guī)模的專業(yè)數(shù)據(jù)服務全職人員,用來構(gòu)建整體 AI 數(shù)據(jù)的生態(tài)。
尾聲:
隨著AI技術(shù)商業(yè)化的持續(xù)深入,算法、算力方興未艾之時,場景化的數(shù)據(jù)成為推動AI深入長尾應用的關(guān)鍵推動力。
作為人工智能領(lǐng)域內(nèi)最值得期待的場景,智能駕駛產(chǎn)業(yè)落地的大門已然開啟。場景化、定制化的高質(zhì)量的數(shù)據(jù)已成為智能駕駛領(lǐng)域最需要的基礎動力之一,而數(shù)據(jù)產(chǎn)業(yè)也將在不斷深入的產(chǎn)業(yè)落地中,為科技的進步和發(fā)展貢獻著力量。