面向國(guó)產(chǎn)具身智能,多模態(tài)“感算控”一體化單芯片解決方案|為旌科技 VS859 亮相第十五屆松山湖論壇
在近期北京亦莊舉辦的機(jī)器人馬拉松中,人形機(jī)器人作為具身智能的代表,仍需人工輔助進(jìn)行散熱、換電池,甚至?xí)霈F(xiàn)跑偏現(xiàn)象。這表明,當(dāng)前的人形機(jī)器人距離人類水平仍有較大差距。未來幾年,針對(duì)特定場(chǎng)景的專用智能體(如工業(yè)或服務(wù)機(jī)器人)將成為產(chǎn)業(yè)落地的主要方向,這也是為旌科技對(duì)具身智能的認(rèn)知和判斷。
在第十五屆松山湖中國(guó)IC創(chuàng)新高峰論壇上,上海為旌科技有限公司市場(chǎng)總監(jiān)黃智先生為我們介紹了VS859芯片,一款面向具身智能的高性能“感算控”一體化芯片。繼去年發(fā)布VS839芯片后,VS859的推出標(biāo)志著公司在機(jī)器人感知、計(jì)算和控制領(lǐng)域的又一重大突破。黃智分享了公司對(duì)人工智能與機(jī)器人融合的洞察,闡述了VS859在推動(dòng)具身智能發(fā)展中的關(guān)鍵作用以及未來的產(chǎn)業(yè)前景。
具身智能演進(jìn):“做好車才能做好機(jī)器人”
具身智能是人工智能(AI)與機(jī)器人技術(shù)交叉融合的產(chǎn)物,也是技術(shù)進(jìn)步的自然結(jié)果。黃智回顧了AI的發(fā)展歷程:從專家系統(tǒng)到機(jī)器學(xué)習(xí)、深度學(xué)習(xí),再到如今需要物理載體的場(chǎng)景化應(yīng)用。機(jī)器人最初被設(shè)計(jì)用于自動(dòng)化,基于人類經(jīng)驗(yàn)或規(guī)則執(zhí)行簡(jiǎn)單、重復(fù)的繁重任務(wù)。隨著技術(shù)進(jìn)步,機(jī)器人從單一的機(jī)械臂替代人工,逐步發(fā)展為需要感知抓取力度、物體位置等復(fù)雜能力的功能模塊。這種演進(jìn)要求機(jī)器人具備更強(qiáng)的感知和決策能力,從而催生了具身智能的核心要素:大腦(認(rèn)知)、小腦(執(zhí)行)與多模態(tài)感知的結(jié)合。
然而,當(dāng)前的具身智能仍未達(dá)到理想狀態(tài)。黃智以自動(dòng)駕駛的分級(jí)方式類比,提出了機(jī)器人自主性的分級(jí)概念。1至3級(jí)為輔助自動(dòng)化階段,機(jī)器人執(zhí)行預(yù)定義指令或特定任務(wù),如機(jī)械臂、移動(dòng)模塊或抓取模塊。從3級(jí)以上,機(jī)器人開始具備自主感知和決策能力。當(dāng)前,感知技術(shù)(如視覺、雷達(dá)、毫米波、雙目深度感知)已接近成熟,產(chǎn)業(yè)化應(yīng)用逐步展開。然而,認(rèn)知能力仍處于初級(jí)階段。盡管像DeepSeek這樣的大型模型在知識(shí)積累上已超越人類,但在邏輯推理、語(yǔ)境理解等方面仍有不足。例如,機(jī)器人需要識(shí)別同一句話在不同語(yǔ)氣、表情或場(chǎng)景下的含義,這需要更深入的學(xué)習(xí)和數(shù)據(jù)積累。
黃智還提到,與自動(dòng)駕駛相比,通用機(jī)器人的發(fā)展面臨更大挑戰(zhàn)。自動(dòng)駕駛已積累了數(shù)十億公里的訓(xùn)練數(shù)據(jù),而通用機(jī)器人缺乏類似規(guī)模的數(shù)據(jù)支持。正如業(yè)內(nèi)人士所說,“做好車才能做好機(jī)器人”,這意味著具身智能的道路仍需長(zhǎng)期探索。
VS859:多模態(tài)的感算控一體芯片級(jí)解決方案
為應(yīng)對(duì)具身智能的復(fù)雜需求,上海為旌科技推出了VS859芯片,該芯片已在2024年北京安博會(huì)上發(fā)布,并實(shí)現(xiàn)量產(chǎn)。VS859是一款高性能、超均衡的單芯片平臺(tái),集感知、計(jì)算和控制于一體,滿足機(jī)器人對(duì)多模態(tài)感知、實(shí)時(shí)處理、低延時(shí)交互和高性價(jià)比的要求。
為旌科技設(shè)計(jì)的VS859芯片平臺(tái),它是一款集成了高性能圖像處理、人工智能(AI)計(jì)算和傳感器數(shù)據(jù)管理的解決方案。該平臺(tái)采用了2核實(shí)時(shí)操作系統(tǒng)(RTOS)工作頻率為1.0GHz,8核ARM Cortex-A55 CPU,頻率為1.5GHz,2核NPU支持每秒6 TOPS的計(jì)算能力(8位精度),同時(shí)配備2核DSP,具有96G FLOPS的性能,能夠有效處理數(shù)據(jù)。該平臺(tái)集成了1.2G像素/秒的高質(zhì)量圖像信號(hào)處理器(ISP),支持多層3D降噪技術(shù),并且采用AI驅(qū)動(dòng)的ISP,確保高質(zhì)量的圖像處理能力。同時(shí),VS859芯片還支持8K@30fps的視頻編碼,采用H.265/H.264視頻編碼格式,適用于高分辨率視頻應(yīng)用。該平臺(tái)支持8K分辨率,具有出色的多層3D降噪技術(shù),可在不同環(huán)境條件下優(yōu)化圖像質(zhì)量,確保圖像清晰且無(wú)噪點(diǎn)。此外,系統(tǒng)還使用了無(wú)損數(shù)據(jù)壓縮等圖像處理技術(shù),以便實(shí)時(shí)處理高質(zhì)量的視頻和圖像數(shù)據(jù)。
在人工智能加速方面,VS859芯片的NPU專為AI工作負(fù)載加速設(shè)計(jì),能顯著提升任務(wù)處理效率,特別適用于目標(biāo)檢測(cè)和人臉識(shí)別等低延遲任務(wù)。其軟件工具鏈包含了量化(Quantization)功能,能夠減少計(jì)算復(fù)雜度,還配有自定義編譯器,優(yōu)化AI模型的運(yùn)行效率。該平臺(tái)還提供豐富的連接選項(xiàng),包括PCIe 3.0、USB 3.0和CAN等,便于與外部設(shè)備的通信。
VS859芯片非常適合用于自動(dòng)駕駛、監(jiān)控和機(jī)器人等應(yīng)用領(lǐng)域,能夠?qū)崟r(shí)處理來自多個(gè)傳感器的數(shù)據(jù)。它支持最多8個(gè)攝像頭模塊,可實(shí)現(xiàn)360°全景視圖,特別適合高精度的追蹤系統(tǒng)和復(fù)雜場(chǎng)景分析,為自主系統(tǒng)提供了強(qiáng)大的解決方案。
結(jié)語(yǔ)
VS859芯片是為旌科技在具身智能業(yè)務(wù)開拓上的重要里程碑,其高性能、超均衡的“感算控”一體化設(shè)計(jì)為下一代機(jī)器人提供了強(qiáng)大支持。通過解決感知、計(jì)算和控制的核心需求,上海為旌科技正推動(dòng)專用機(jī)器人在多樣化場(chǎng)景中的落地應(yīng)用。隨著公司持續(xù)創(chuàng)新,VS859及未來芯片有望在產(chǎn)業(yè)轉(zhuǎn)型中發(fā)揮關(guān)鍵作用,助力具身智能成為現(xiàn)實(shí)。