以前,讓失明者重見光明往往被視為一種醫(yī)學"奇跡"。而隨著以"機器視覺+自然語言理解"為代表的多模態(tài)智能技術的爆發(fā)式突破,給AI助盲帶來新的可能,更多的失明者將借助AI提供的感知、理解與交互能力,以另一種方式重新"看見世界"。
AI助盲,讓更多人重新"看見世界"
一般來說,目不能視的視障患者認知外界世界的渠道是除了視覺之外的其它感官感覺,比如聽覺、嗅覺和觸覺,這些其他模態(tài)的信息一定程度上幫助視障人士緩解了視力缺陷帶來的問題。但科學研究表明,在人類獲取的外界信息中,來自視覺的占比高達70%~80%。因此基于AI構建機器視覺系統(tǒng),幫助視障患者擁有對外界環(huán)境的視覺感知與視覺理解能力,無疑是最直接有效的解決方案。
在視覺感知領域,當下的單模態(tài)AI模型已經在圖像識別任務上超越了人類水平,但這類技術目前只能實現(xiàn)視覺模態(tài)內的識別及理解,難以完成與其他感覺信息交叉的跨模態(tài)學習、理解與推理,簡單來說,就是只能感知無法理解。為此,計算視覺奠基人之一的?David Marr 在《視覺》一書中提出了視覺理解研究的核心問題,認為視覺系統(tǒng)應以構建環(huán)境的二維或三維表達,并可以與之交互。這里的交互意味著學習、理解和推理??梢姡瑑?yōu)秀的AI助盲技術,其實是一個包含了智能傳感、智能用戶意圖推理和智能信息呈現(xiàn)的系統(tǒng)化工程,只有如此才能構建信息無障礙的交互界面。
數(shù)據是實現(xiàn)可持續(xù)發(fā)展目標的關鍵要素, 許多企業(yè)領導者認識到,要朝著可持續(xù)發(fā)展目標邁進,他們需要擁有有意義的環(huán)境、社會和治理 (ESG) 數(shù)據, 以幫助他們評估進展。 好消息是,組織運營中有大量可用的環(huán)境數(shù)據,這些數(shù)據可以從設施運營、能源消耗、資產維護、IT 基礎設施等中提取。
同時,收集和理解那些位于公司不同孤島中的海量數(shù)據也是一項非常艱巨的任務。企業(yè)還必須能夠根據復雜的 ESG 框架向各個利益相關方報告數(shù)據。
在接下來的一年里,各利益相關方將要求企業(yè)領導對公司的可持續(xù)發(fā)展工作承擔更多責任。企業(yè)將求助于自動化技術來收集和整合數(shù)百種數(shù)據類型,以持續(xù)提供透明、可核查、財務級別的信息并報告進展。
人工智能可以幫助企業(yè)管理、分析和利用運營中大量可用的數(shù)據,利用設施運營、能源消耗、資產維護、IT 基礎設施等位于公司不同孤島中的數(shù)據,基于混合云底座實現(xiàn)數(shù)據流轉,幫助企業(yè)根據復雜的 ESG 框架向各個利益相關方報告數(shù)據,并將其轉化為預測性洞察,可用于評估可持續(xù)發(fā)展基準的進展,從而幫助企業(yè)減少日常業(yè)務運營對環(huán)境的影響。
據了解,截至目前,全國智慧城市場景相關AI專利申請量共計18萬余件,其中發(fā)明專利占比約90%,百度、騰訊、國家電網成為技術創(chuàng)新活躍主體,專利數(shù)量均超過2000件。智慧城市建設涉及的AI技術主要包括知識圖譜、計算機視覺、大數(shù)據、自然語言處理、智能語音和智能云等。同一時期內智慧交通相關AI專利申請量計14萬余件,發(fā)明專利占比約71%,百度、東南大學、騰訊成為專利申請更為積極的創(chuàng)新主體,專利申請均突破千余件,智慧交通開發(fā)應用主要包含深度學習、自然語言處理、大數(shù)據、智能云、智能語音和智能推薦等人工智能技術。
據悉,截至2022年9月,我國智慧教育場景申請AI專利近2萬件,其中發(fā)明專利占比超過九成,好未來、小天才、松鼠課堂等智能教育領域企業(yè)專利申請活躍,好未來專利申請超過280余件,其余兩位也均達百余件,智慧教育主要依托的AI技術為計算機視覺、知識圖譜、深度學習、自然語言處理和智能語音。智慧農業(yè)場景中,我國同期申請AI專利約6.7萬件,其中發(fā)明專利占比超過90%,浙江大學以590余件專利排名首位,騰訊以550余件專利緊隨其后。智慧農業(yè)主要涉及的AI技術主要為智能云、大數(shù)據、計算機視覺、深度學習等。