企業(yè)級AI的未來:IBM實現(xiàn)通用型企業(yè)級 AI 智能體的重大突破
![]() |
---|
作者:吳敏達,IBM科技事業(yè)部數(shù)據(jù)與人工智能資深技術專家
作者簡介:吳敏達是 The Open Group 卓越級技術專家(Distinguished Technical Specialist),同時擁有計算機技術與軟件專業(yè)系統(tǒng)架構設計師技術資格。他現(xiàn)在是 IBM 科技事業(yè)部數(shù)據(jù)與人工智能資深技術專家,擁有 20 多年數(shù)據(jù)分析軟件相關技術經(jīng)驗,是 IBM 認證的大數(shù)據(jù)架構師和 Watson 開發(fā)者,專長是大數(shù)據(jù)、人工智能等領域。他是 IBM Developer 的大師級作者,已經(jīng)發(fā)表了 40 余篇技術文章和教程?,F(xiàn)從事大數(shù)據(jù)、人工智能相關技術支持和架構設計工作。
北京2025年7月21日 /美通社/ -- 在AI發(fā)展日新月異的今天,AI智能體無疑正處在技術前沿。近日,IBM發(fā)布了通用型企業(yè)級AI智能體(IBM Computer Using Generalist Agent,此后簡稱IBM CUGA)的重要突破,引發(fā)業(yè)界廣泛關注。繼 Think 2025大會上發(fā)布AI 智能體平臺watsonx Orchestrate后,IBM研究院在企業(yè)級智能體領域再次邁出了實質性的一大步。
IBM實現(xiàn)通用型企業(yè)級 AI 智能體的重大突破
IBM CUGA
如今,IBM CUGA不僅在模擬企業(yè)場景中經(jīng)受住了嚴苛測試,更在最新(2025年7月)的AppWorld Benchmark中榮登第一(注:AppWorld Benchmark 是一個由多個研究機構和學者共同創(chuàng)建、用于評估交互式編程智能體的基準測試環(huán)境)。在不久的未來,我們或許能看到AI 智能體逐步從"實驗室玩具"邁向"企業(yè)核心助手"。
通用型企業(yè)級AI智能體是什么?為何重要?
傳統(tǒng)AI智能體在企業(yè)應用中多是"單一功能專家"——比如處理發(fā)票、生成郵件、跟蹤銷售進度等。這些功能雖然實用,但面對跨流程、跨系統(tǒng)、跨業(yè)務的復雜場景時,往往會顯得力不從心。
IBM CUGA 正是為復雜業(yè)務場景而生。它是一種能夠跨多個業(yè)務場景、整合多種工具、執(zhí)行復雜任務的通用型智能體,可以像資深員工一樣理解用戶意圖、規(guī)劃任務、調(diào)用工具、協(xié)調(diào)多個系統(tǒng),并不斷學習和適應新的挑戰(zhàn)。
榮耀背后,是技術進階和厚積薄發(fā)
IBM CUGA的出現(xiàn)并不是一蹴而就的,它是架構進化、方法創(chuàng)新和工具集成的系統(tǒng)性成果:
- 架構演進:從最初簡單的"計劃-執(zhí)行-觀察"模型(完成率15%),進化到如今能協(xié)調(diào)多個子智能體、感知網(wǎng)頁環(huán)境、處理復雜任務的多層級系統(tǒng),任務完成率提升到 61.7% 甚至更高。[1]
- 工具賦能:
- 實時性能儀表盤,掌握每一個智能體動作的效果;
- 軌跡可視化工具,直觀診斷失敗原因;
- 并行執(zhí)行框架,將評估速度從數(shù)天壓縮到數(shù)分鐘。
- 多智能體協(xié)作:一個任務由多個"子任務智能體"協(xié)同完成。比如,規(guī)劃、執(zhí)行、信息提取各司其職,讓智能體能像團隊一樣作戰(zhàn)。
- 環(huán)境感知增強:結合網(wǎng)頁截圖和可訪問性樹,智能體看得更清、操作更準,還能識別彈窗等障礙進行規(guī)避。
安全、可信、可控的智能體平臺,打造適配業(yè)務需求的AI智能體
IBM不僅關注智能體的"聰明程度",更重視它的"企業(yè)適配能力"。借助最新發(fā)布的企業(yè)級AI 智能體平臺watsonx Orchestrate,客戶有望實現(xiàn):
- 全生命周期可觀測性,兼顧性能監(jiān)控、模型優(yōu)化、安全防護;
- 無代碼與專業(yè)工具并存,既支持業(yè)務人員快速部署,也支持開發(fā)者深度定制;
- 兼容超過80種企業(yè)級系統(tǒng),與Adobe、SAP、Salesforce、ServiceNow等生態(tài)無縫集成;
- 治理與合規(guī),為隱私、安全、成本可控提供保障,幫助企業(yè)實現(xiàn)AI治理與合規(guī)。
IBM致力于打造安全、可信、可控的AI智能體平臺
真正的"企業(yè)AI助手" 正在加速來到
除了在AppWorld基準測試奪魁,IBM CUGA還在WebArena等真實瀏覽器任務中展現(xiàn)強大能力。通過"智能采樣"、"反饋反射"、"知識注入"等一系列創(chuàng)新方法,CUGA每一次迭代都更接近企業(yè)級實用標準。
真正的“企業(yè)AI助手” 正在加速來到
IBM CUGA不是實驗室的"炫技",而是指向未來企業(yè)運營方式的變革。在準確率達到更高門檻后,CUGA有望成為企業(yè)內(nèi)部的通用調(diào)度平臺——不再是被動響應用戶指令,而是主動協(xié)助完成復雜的工作任務,例如跨系統(tǒng)的數(shù)據(jù)整合、文檔生成、流程管理等。
團隊心聲
"CUGA的成功,不是因為某一個神奇的模型,而是靠IBM團隊對創(chuàng)新的執(zhí)著、對真實企業(yè)需求的深刻理解。感謝每一位參與其中的工程師、研究員和產(chǎn)品經(jīng)理。"
- 想了解CUGA背后的技術細節(jié)與實踐經(jīng)驗?
- 可以直接聯(lián)系IBM團隊,了解如何部署屬于你企業(yè)的AI智能體
- 歡迎訪問下方鏈接,注冊參加IBM將于7月24-25日在北京舉行的AI智能體技術賦能工作坊,了解AI智能體在真實場景中的創(chuàng)新應用,助力企業(yè)構建智能化競爭力。
關于IBM
IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數(shù)據(jù)中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現(xiàn)數(shù)字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。