上海人工智能實驗室聯(lián)合商湯科技及高校發(fā)布通用視覺開源平臺OpenGVLab

時間：2022-02-25 15:38:56

關(guān)鍵字：人工智能開源 AI模型

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]2月25日,上海人工智能實驗室聯(lián)合商湯科技、香港中文大學(xué)、上海交通大學(xué)共同發(fā)布通用視覺開源平臺OpenGVLab,面向?qū)W術(shù)界和產(chǎn)業(yè)界開放其超高效預(yù)訓(xùn)練模型,和千萬級精標注、十萬級標簽量的公開數(shù)據(jù)集,為全球開發(fā)者提升各類下游視覺任務(wù)模型訓(xùn)練提供重要支持。

2月25日,上海人工智能實驗室聯(lián)合商湯科技、香港中文大學(xué)、上海交通大學(xué)共同發(fā)布通用視覺開源平臺OpenGVLab,面向?qū)W術(shù)界和產(chǎn)業(yè)界開放其超高效預(yù)訓(xùn)練模型,和千萬級精標注、十萬級標簽量的公開數(shù)據(jù)集,為全球開發(fā)者提升各類下游視覺任務(wù)模型訓(xùn)練提供重要支持。同時,OpenGVLab還同步開放了業(yè)內(nèi)首個針對通用視覺模型的評測基準,便于開發(fā)者對不同通用視覺模型的性能進行橫向評估和持續(xù)調(diào)優(yōu)。目前OpenGVLab開源平臺已正式上線,供各界研究人員訪問和使用,后續(xù)項目還將開通在線推理功能,供所有對人工智能視覺技術(shù)感興趣的社會人士自由體驗。

上海人工智能實驗室聯(lián)合商湯科技及高校發(fā)布通用視覺開源平臺OpenGVLab

“開源是一項意義非凡的工作,人工智能技術(shù)的迅速發(fā)展離不開全球研究人員十余年來的開源共建”,上海人工智能實驗室負責(zé)人表示,“希望通過發(fā)布OpenGVLab開源平臺,幫助業(yè)界更好地探索和應(yīng)用通用視覺AI技術(shù),促進體系化解決AI發(fā)展中數(shù)據(jù)、泛化、認知和安全等諸多瓶頸問題,為推動人工智能學(xué)術(shù)、產(chǎn)業(yè)發(fā)展做出貢獻?！?

如今雖然人工智能技術(shù)快速發(fā)展,但很多AI模型還只能完成單一任務(wù),比如識別單一物體,或識別風(fēng)格較為統(tǒng)一的照片。如果要對多種類型、風(fēng)格進行識別,則需要具備足夠的通用性和泛化能力。去年11月,上海人工智能實驗室聯(lián)合商湯科技、香港中文大學(xué)、上海交通大學(xué)發(fā)布的通用視覺技術(shù)體系“書生”,很好地解決了這一問題。如下圖所示,對于不同類型的圖片,它都能較為準確地識別出圖中的內(nèi)容,包括圖畫。

上海人工智能實驗室聯(lián)合商湯科技及高校發(fā)布通用視覺開源平臺OpenGVLab

通用視覺開源平臺OpenGVLab正是基于通用視覺技術(shù)體系“書生”(INTERN)打造的。依托“書生”在通用視覺技術(shù)上的強勁支撐,OpenGVLab將幫助開發(fā)者顯著降低通用視覺模型的開發(fā)門檻,用更低成本快速開發(fā)用于成百上千種視覺任務(wù)、視覺場景的算法模型,高效實現(xiàn)對長尾場景的覆蓋,推動AI技術(shù)的規(guī)?；瘧?yīng)用。

開放超高性能模型和千萬級精標注數(shù)據(jù)集,降低學(xué)界投入成本

OpenGVLab充分繼承了通用視覺技術(shù)體系“書生”的技術(shù)優(yōu)勢,其開源的預(yù)訓(xùn)練模型具備極高性能。相較于此前公認的最強開源模型(OpenAI 于2021年發(fā)布的CLIP),OpenGVLab的模型可全面覆蓋分類、目標檢測、語義分割、深度估計四大視覺核心任務(wù),在準確率和數(shù)據(jù)使用效率上均取得大幅提升。

基于同樣的下游場景數(shù)據(jù),開源模型在分類、目標檢測、語義分割及深度估計四大任務(wù)26個數(shù)據(jù)集上,平均錯誤率分別降低了40.2%、47.3%、34.8%和9.4%;同時,在分類、檢測、分割和深度估計中,僅用10%的下游訓(xùn)練數(shù)據(jù)就超過了現(xiàn)有其他開源模型。使用此模型,研究人員可以大幅降低下游數(shù)據(jù)采集成本,用極低的數(shù)據(jù)量,即可快速滿足多場景、多任務(wù)的AI模型訓(xùn)練。

同時,OpenGVLab還提供多種不同參數(shù)量、不同計算量的預(yù)訓(xùn)練模型,以滿足不同場景的應(yīng)用需求。模型庫中列出的多個模型,在ImageNet的微調(diào)結(jié)果和推理資源、速度等方面,相比之前的公開模型均有不同程度的性能提升。

除了預(yù)訓(xùn)練模型,以百億數(shù)據(jù)總量為基礎(chǔ),上海人工智能實驗室構(gòu)建了超大量級的精標注數(shù)據(jù)集,近期將進行數(shù)據(jù)開源工作。超大量級的精標注數(shù)據(jù)集不僅整合了現(xiàn)有的開源數(shù)據(jù)集,還通過大規(guī)模數(shù)據(jù)圖像標注任務(wù),實現(xiàn)了對圖像分類、目標檢測以及圖像分割等任務(wù)的覆蓋,數(shù)據(jù)總量級近七千萬。開源范圍涵蓋千萬級精標注數(shù)據(jù)集和十萬級標簽體系。目前,圖像分類任務(wù)數(shù)據(jù)集已率先開源,后續(xù)還將開源目標檢測任務(wù)等更多數(shù)據(jù)集。

此外,此次開源的超大標簽體系不僅幾乎覆蓋了所有現(xiàn)有開源數(shù)據(jù)集,還在此基礎(chǔ)上擴充了大量細粒度標簽,涵蓋各類圖像中的屬性、狀態(tài)等,極大豐富了圖像任務(wù)的應(yīng)用場景,顯著降低下游數(shù)據(jù)的采集成本。研究人員還可以通過自動化工具添加更多標簽,對數(shù)據(jù)標簽體系進行持續(xù)擴展和延伸,不斷提高標簽體系的細粒度,共同促進開源生態(tài)繁榮發(fā)展。

發(fā)布首個通用視覺評測基準,推動通用視覺模型評測標準統(tǒng)一

伴隨OpenGVLab的發(fā)布,上海人工智能實驗室還開放了業(yè)內(nèi)首個針對通用視覺模型的評測基準,彌補通用視覺模型評測領(lǐng)域的空白。當(dāng)前,行業(yè)中已有的評測基準主要針對單一任務(wù)、單一視覺維度設(shè)計,無法反映通用視覺模型的整體性能,難以用于橫向比較。全新的通用視覺評測基準憑借在任務(wù)、數(shù)據(jù)等層面的創(chuàng)新設(shè)計,可以提供權(quán)威的評測結(jié)果,推動統(tǒng)一標準上的公平和準確評測,加快通用視覺模型的產(chǎn)業(yè)化應(yīng)用步伐。

在任務(wù)設(shè)計上,全新開放的通用視覺評測基準創(chuàng)新地引入了多任務(wù)評測體系,可以從分類、目標檢測、語義分割、深度估計、行為識別5類任務(wù)方向,對模型的通用性能進行整體評估。不僅如此,該評測基準新加了僅用測試數(shù)據(jù)集10%數(shù)據(jù)量的評測設(shè)定,可以有效評估通用模型在真實數(shù)據(jù)分布下的小樣本學(xué)習(xí)能力。在測試后,評測基準還會根據(jù)模型的評測結(jié)果給出相應(yīng)的總分,方便使用者對不同的模型進行橫向評測。

隨著人工智能與產(chǎn)業(yè)融合的不斷深入,行業(yè)對人工智能的需求逐漸從單一任務(wù)向復(fù)雜的多任務(wù)協(xié)同發(fā)展,亟需構(gòu)建開源、開放的體系,以滿足趨于碎片化和長尾化的海量應(yīng)用需求。

去年7月,上海人工智能實驗室發(fā)布開源平臺體系OpenXLab,涵蓋新一代OpenMMLab和決策AI平臺OpenDILab。此次與商湯科技及高校聯(lián)合發(fā)布通用視覺開源平臺OpenGVLab,不僅能幫助開發(fā)者降低通用視覺模型的開發(fā)門檻,為推動通用視覺技術(shù)發(fā)展奠定基礎(chǔ),也進一步完善了OpenXLab開源體系,促進人工智能的基礎(chǔ)研究和生態(tài)構(gòu)建。

本站聲明：本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時聯(lián)系本站刪除。

換一批

征拓亮相 IFA 2025 柏林國際消費電子展央視采訪聚焦中國新能源創(chuàng)新

廣州2025年9月9日 /美通社/ -- 在2025年柏林國際消費電子展（IFA 2025）上，來自中國的清潔能源科技企業(yè)，廣州疆海科技有限公司（征拓）以其前沿的...

關(guān)鍵字：新能源消費電子展人工智能清潔能源

[美通社全球TMT]

上海外服攜AI智能體求職助手"凌佳佳"亮相上海市第二屆人力資源服務(wù)業(yè)創(chuàng)新發(fā)展大會

上海2025年9月9日 /美通社/ -- 為全面落實黨中央、國務(wù)院和上海市委、市政府關(guān)于加快發(fā)展人力資源服務(wù)業(yè)的決策部署，更好發(fā)揮人力資源服務(wù)業(yè)賦能百業(yè)作用，8月29日，以"AI智領(lǐng) HR智鏈靜候你來&quo...

關(guān)鍵字：智能體 AI BSP 人工智能

[美通社全球TMT]

TüV萊茵深圳舉辦研討會共話數(shù)字智能時代汽車行業(yè)安全與合規(guī)新挑戰(zhàn)

深圳2025年9月9日 /美通社/ -- 2025年9月3日，國際獨立第三方檢測、檢驗和認證機構(gòu)德國萊茵TÜV大中華區(qū)（以下簡稱"TÜV萊茵&q...

關(guān)鍵字：研討會汽車行業(yè) ISO 人工智能

[通信先鋒]

權(quán)威報告：中國AI云市場阿里云占比35.8%位列第一

9月9日消息，今日，國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布《中國AI云市場，1H25》報告。

關(guān)鍵字： AI 人工智能

[西門子EDA]

人工智能對工業(yè)價值鏈的影響

面對市場對更智能產(chǎn)品、更短設(shè)計周期以及更高效靈活生產(chǎn)流程的需求日益增長，設(shè)計與制造企業(yè)紛紛借助人工智能，推動業(yè)務(wù)流程邁向新高度。憑借處理復(fù)雜數(shù)據(jù)的卓越能力與傳遞智能洞見的便捷性，人工智能已準備好在工業(yè)價值鏈的各個環(huán)節(jié)承擔(dān)...

關(guān)鍵字：人工智能工業(yè)物聯(lián)網(wǎng) 傳感器

[美通社全球TMT]

世界智能產(chǎn)業(yè)博覽會于重慶開幕，人工智能與新能源汽車成焦點

重慶2025年9月6日 /美通社/ -- iChongqing新聞報道：2025世界智能產(chǎn)業(yè)博覽會于9月5日在重慶開幕，550余家企業(yè)參展，展示了從自動駕駛和人工智能(AI)座艙到擴展現(xiàn)實(XR)影視和機器人咖啡廳的30...

關(guān)鍵字：人工智能新能源汽車 AI 機器人

[美通社全球TMT]

北京經(jīng)開區(qū)構(gòu)建五大支撐體系，加快建設(shè)全域人工智能之城

北京2025年9月5日 /美通社/ -- 9月4日，在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上，北京經(jīng)開區(qū)對外發(fā)布，北京經(jīng)濟技術(shù)開發(fā)區(qū)（簡稱"北京經(jīng)開區(qū)&q...

關(guān)鍵字：人工智能模型開源 AI

[美通社全球TMT]

北京經(jīng)開區(qū)全力打造國際一流營商環(huán)境

二十余項改革全國全市推廣，700余事項100%全程網(wǎng)辦北京2025年9月5日 /美通社/ -- 9月4日，在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上，北京經(jīng)開區(qū)對...

關(guān)鍵字： DIY 人工智能加速器機器人

[美通社全球TMT]

北京經(jīng)開區(qū)全力打造新質(zhì)生產(chǎn)力典范區(qū)

"十四五"期間GDP年均增長9.6%，每年安排產(chǎn)業(yè)發(fā)展資金超百億元北京2025年9月5日 /美通社/ -- 9月4日，在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系...

關(guān)鍵字：人工智能自動駕駛集成電路 4S店

[美通社全球TMT]

人工智能引領(lǐng)體育未來：第三屆全國體育人工智能大會將于10月底在京啟幕

北京2025年9月4日 /美通社/ --?在全球新一輪科技革命與產(chǎn)業(yè)變革的澎湃浪潮中，人工智能作為引領(lǐng)創(chuàng)新的核心驅(qū)動力，正以前所未有的深度與廣度重塑各行業(yè)發(fā)展格局。體育領(lǐng)域深度融入科技變革浪潮，駛?cè)霐?shù)字化、智能化轉(zhuǎn)型快車...

關(guān)鍵字：人工智能智能體 AI BSP