圖像識(shí)別讓機(jī)器人擁有眼睛可以像人類一樣看世界
圖像識(shí)別、AI、無(wú)人駕駛、機(jī)器人等未來(lái)趨勢(shì)技術(shù),被一班年輕大學(xué)生“玩”出新高度。作為國(guó)際性的大學(xué)生機(jī)器人賽事,第十七屆全國(guó)大學(xué)機(jī)器人大賽2018 RoboMaster機(jī)甲大賽日前圓滿落幕,本屆大賽共吸引了全世界近200支戰(zhàn)隊(duì)和近萬(wàn)名學(xué)生參加,經(jīng)過(guò)近5個(gè)月激烈比賽,廣州本地高校華南理工大學(xué)“華南虎”戰(zhàn)隊(duì),憑借過(guò)硬的實(shí)力成為衛(wèi)冕冠軍。
每屆機(jī)甲大賽的最大亮點(diǎn)就是體現(xiàn)高端制造業(yè)發(fā)展趨勢(shì),今年圖像識(shí)別的應(yīng)用成為決勝的重要因素之一。目前,圖像識(shí)別是除語(yǔ)音識(shí)別外,人機(jī)交互的重要手段之一。蘋果、微軟、谷歌、英特爾、華為等企業(yè)都紛紛致力于讓機(jī)器具備深度學(xué)習(xí)能力,讓圖形識(shí)別更智能,讓計(jì)算機(jī)、機(jī)器人“看”世界。
今年的RoboMaster(以下簡(jiǎn)稱RM)機(jī)甲大賽類似于手機(jī)游戲《王者榮耀》的模式,被稱為《王者》的機(jī)器人版。一支團(tuán)隊(duì)分為英雄機(jī)器人、步兵機(jī)器人、工程機(jī)器人、空中機(jī)器人、哨兵機(jī)器人共5個(gè)角色,其中,步兵機(jī)器人有三個(gè),其他角色機(jī)器人均有一個(gè)。對(duì)戰(zhàn)雙方通過(guò)機(jī)器人之間的協(xié)同工作、射擊等進(jìn)行對(duì)抗,最后“擊毀”對(duì)方基地或基地血量高者勝利,而且每局限制在7分鐘之內(nèi)。
機(jī)甲大賽的科技含量在于參賽戰(zhàn)隊(duì)需要操作團(tuán)隊(duì)親自研發(fā)的機(jī)器人,從一個(gè)細(xì)小的零件開(kāi)始,焊接、裝拼、核心主板裝嵌、無(wú)人機(jī)改裝、寫程序、調(diào)試……到最后完成和操控一支機(jī)器人隊(duì)伍。近日,全媒體記者來(lái)到位于華南理工大學(xué)五山校區(qū)的機(jī)器人實(shí)驗(yàn)室,里面放置著零件焊接的機(jī)器、無(wú)數(shù)的裝配工具、排線、電路板等,還有用于寫程序的電腦。
要制作如此高比賽級(jí)別的機(jī)器人,過(guò)程是漫長(zhǎng)的,經(jīng)歷無(wú)數(shù)次反復(fù)制作與測(cè)試。例如步兵機(jī)器人頂端是一個(gè)云臺(tái),包含了子彈發(fā)射器,底部是四個(gè)輪子組成、能靈活轉(zhuǎn)向的“車輛”。隊(duì)員李佩佩表示,目前這款參加比賽的步兵機(jī)器人,不是團(tuán)隊(duì)做出來(lái)的“唯一”步兵機(jī)器人,“之前有機(jī)器人已經(jīng)做出來(lái)了,因?yàn)橹挥凶龀鰧?shí)物,并且達(dá)到較為完整的程度,才能進(jìn)行測(cè)試。雖然比如今這輛更加小巧和靈活,但由于車速以及穩(wěn)定性沒(méi)有后者快與良好,所以被放棄了”。一臺(tái)步兵機(jī)器人從機(jī)械加工到電控“上電”,完成出來(lái)大概半個(gè)月時(shí)間。據(jù)介紹,制造出一臺(tái)英雄機(jī)器人大概需要6位成員共同完成。整個(gè)戰(zhàn)隊(duì)中,工程與英雄機(jī)器人復(fù)雜性相對(duì)較高,其中,英雄機(jī)器人的難點(diǎn)在需要快速“取彈”,這是比賽決勝因素之一,“我們的優(yōu)勢(shì)就在于英雄機(jī)器人取彈快,一次性能取兩個(gè)彈藥箱,時(shí)間在2~3秒之間?!标?duì)員李佩佩說(shuō)。
衛(wèi)冕“秘籍”:
視覺(jué)研發(fā) 幫助機(jī)器人自動(dòng)瞄準(zhǔn)更精確盡管RM大賽每年的規(guī)則都有所更新,今年采用的技術(shù)和零件明年不能用,但是由于大賽有一項(xiàng)固定規(guī)則就是射擊,因此打擊、識(shí)別、發(fā)射等項(xiàng)目都是一眾強(qiáng)隊(duì)鉆研的方向。
根據(jù)賽制,發(fā)射出的子彈必須打在對(duì)方機(jī)器人身上規(guī)定的裁判系統(tǒng)位置才算有效——讓對(duì)方扣掉血量。射擊技術(shù)的一個(gè)核心是機(jī)器人射擊子彈的彈道要穩(wěn)定與精準(zhǔn),RM官方對(duì)子彈的射速有上限規(guī)定,每個(gè)具備射擊能力的機(jī)器人的子彈發(fā)射口都有一個(gè)測(cè)速的裝置,假如檢測(cè)到子彈超速就會(huì)扣掉血量。所以,參賽隊(duì)伍都會(huì)盡量在限速的情況下做到高速。
視覺(jué)組成員楊澤霖對(duì)此解釋道,比如RM官方的限速是25米/秒,團(tuán)隊(duì)就要做到每顆子彈的速度均是24~25米/秒,并且一顆子彈都不超過(guò)上限。另外,子彈不能卡住“槍管”,若是卡住了就全場(chǎng)都不能發(fā)彈了——這亦是眾多隊(duì)伍遇到的難題之一。楊澤霖介紹,今年的機(jī)器人采用了較多的氣動(dòng)結(jié)構(gòu),相比用電機(jī)而言,前者取彈速度更快,而且也加入了眾多的自動(dòng)輔助技術(shù),例如使用相機(jī)自動(dòng)對(duì)位,相比人工對(duì)位,前者更加穩(wěn)定、準(zhǔn)確和快速。據(jù)了解,上屆賽事中僅有極個(gè)別隊(duì)伍采用了自動(dòng)瞄準(zhǔn)技術(shù),到了本屆比賽,這一技術(shù)已成機(jī)器人的“標(biāo)配”。據(jù)視覺(jué)組隊(duì)員楊澤霖表示,團(tuán)隊(duì)機(jī)器人身上裝載的攝像頭能自動(dòng)識(shí)別對(duì)方,自動(dòng)跟隨過(guò)去,這也是圖形識(shí)別技術(shù)的應(yīng)用。
機(jī)器人擁有“眼睛”視覺(jué)測(cè)試需要反復(fù)多次調(diào)試
據(jù)了解,華工戰(zhàn)隊(duì)今年主要將圖像識(shí)別運(yùn)用到了各機(jī)器人的自動(dòng)瞄準(zhǔn)、步兵機(jī)器人激活大小能量機(jī)關(guān)、工程和英雄機(jī)器人自動(dòng)取箱、補(bǔ)給機(jī)器人自動(dòng)給子彈這4個(gè)方面,“今年所有機(jī)器人都加載視覺(jué)識(shí)別程序,例如補(bǔ)給站機(jī)器人就是自動(dòng)識(shí)別并跟機(jī)器人對(duì)接進(jìn)行補(bǔ)彈的”,視覺(jué)組隊(duì)員解釋,圖像識(shí)別技術(shù)使機(jī)器人的速度和穩(wěn)定性有很大提升。
然而,為機(jī)器人裝上攝像頭,寫入自動(dòng)圖像識(shí)別程序后,讓它能準(zhǔn)確地識(shí)別圖像并不簡(jiǎn)單?!耙?yàn)閷?shí)際環(huán)境與工業(yè)試驗(yàn)環(huán)境是兩回事”,視覺(jué)組成員成斌告訴全媒體記者,團(tuán)隊(duì)有一個(gè)獨(dú)立的視覺(jué)實(shí)驗(yàn)室進(jìn)行機(jī)器人視覺(jué)測(cè)試,測(cè)試并非一兩次就能完成,需要多次反復(fù)調(diào)試。因?yàn)閷?shí)際場(chǎng)景的光照強(qiáng)度、光照方向、曝光時(shí)間和增益等,都會(huì)影響機(jī)器人的視覺(jué)“能力”。例如在賽場(chǎng)上復(fù)雜的光線或者突如其來(lái)的光照,都會(huì)給機(jī)器人戰(zhàn)隊(duì)的視覺(jué)系統(tǒng)帶來(lái)困難。視覺(jué)組隊(duì)員表示,他們需要做足夠多的實(shí)驗(yàn)測(cè)試,模擬實(shí)際環(huán)境較為充分,“我們會(huì)模擬不同的光線情況,將眾多的實(shí)際情況考慮進(jìn)去”。
據(jù)了解,目前團(tuán)隊(duì)所研究的識(shí)別技術(shù),優(yōu)勢(shì)在于延時(shí)低、轉(zhuǎn)換回來(lái)的坐標(biāo)較為精準(zhǔn),這讓機(jī)器人打擊的準(zhǔn)確率很高。
讓機(jī)器像人類一樣觀察和理解世界未來(lái):除了圖像 還有視頻識(shí)別
作為機(jī)器視覺(jué)系統(tǒng)的重要組成部分之一的圖像處理應(yīng)用,相當(dāng)于人的大腦對(duì)系統(tǒng)獲取的圖像,做出正確判斷。除了在攝像頭中加入圖形識(shí)別功能外,據(jù)了解,今年華工戰(zhàn)隊(duì)的機(jī)器人換上了麒麟970,這個(gè)人工智能移動(dòng)計(jì)算平臺(tái)最大的特點(diǎn)之一是AI場(chǎng)景識(shí)別,因?yàn)槌?u>CPU外,更擁有具有獨(dú)立神經(jīng)處理單元(NPU),AI運(yùn)算相比CPU處理能效提升50倍,性能提升25倍。據(jù)了解,從去年全球科技廠商蘋果在iPhone X上使用了具備神經(jīng)網(wǎng)絡(luò)引擎的A11仿生處理器后,目前,眾多科技廠商的高端處理器都帶有了“深度學(xué)習(xí)”能力,并且集中“火力”在圖像識(shí)別上。高通、英特爾、谷歌、英偉達(dá)等都專門開(kāi)發(fā)針對(duì)圖像識(shí)別的平臺(tái)。
圖像識(shí)別,被認(rèn)為是人工智能科技領(lǐng)域中,除語(yǔ)音交互外,人機(jī)交互中的重要手段之一,例如目前消費(fèi)者們經(jīng)常在中高端手機(jī)產(chǎn)品上看到的人臉識(shí)別技術(shù),就是圖像識(shí)別功能之一。另外,目前眾多智能終端擁有AI拍照功能、相冊(cè)篩選等等,同樣是圖像識(shí)別發(fā)揮著重要的作用。
根據(jù)科技行業(yè)最新的消息稱,日前,谷歌拋出了新的黑科技:視頻內(nèi)容識(shí)別。通過(guò)這一技術(shù),能夠識(shí)別視頻當(dāng)中的各種動(dòng)物、物體、風(fēng)景等內(nèi)容,例如你要在視頻當(dāng)中搜索一只狗,搜索引擎很快就能為用戶找出視頻中包括狗的畫面。業(yè)界解釋,其中可以通過(guò)圖像識(shí)別的原理來(lái)理解視頻識(shí)別。實(shí)際上,國(guó)內(nèi)有物聯(lián)網(wǎng)團(tuán)隊(duì)亦致力于這一方面,正把圖形識(shí)別、視頻識(shí)別的研究用于在城市交通監(jiān)測(cè)當(dāng)中。
記者觀察
科技技術(shù)有應(yīng)用場(chǎng)景,才得以深入發(fā)展以及發(fā)掘新的研究方向。“華南虎”戰(zhàn)隊(duì)的指導(dǎo)老師、來(lái)自華南理工大學(xué)機(jī)械與汽車工程學(xué)院講師張東認(rèn)為,只有通過(guò)動(dòng)手實(shí)踐,知識(shí)才能真正掌握,成為有價(jià)值有意義的知識(shí)。
作為國(guó)際性的機(jī)器人賽事,機(jī)甲大賽并非僅有刺激性與觀賞性??v觀整個(gè)比賽的機(jī)器人競(jìng)技模式,除了不同角色的機(jī)器人本身?yè)碛胁煌昂鹆俊钡募夹g(shù)外,更重要的是團(tuán)隊(duì)合作、整體戰(zhàn)術(shù),以及考驗(yàn)不同角色機(jī)器人之間的協(xié)同。業(yè)內(nèi)專家表示,多機(jī)器人的協(xié)同控制在學(xué)術(shù)圈是研究熱點(diǎn)。今年3月在平昌冬奧會(huì)閉幕式的“北京八分鐘”表演中,我國(guó)新松的24臺(tái)人工智能機(jī)器人控制著“冰屏”與24名輪滑演員,配合地面投影不斷變幻曼妙舞姿,當(dāng)中講求的就是多機(jī)協(xié)同、人機(jī)協(xié)同——如果有一臺(tái)機(jī)器人稍有延遲或動(dòng)作偏差,整個(gè)演出都會(huì)失敗。