www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 消費(fèi)電子 > 消費(fèi)電子
[導(dǎo)讀]相信在人們的印象里,AI都是一個(gè)屬于“大多數(shù)”的技術(shù)門類。

相信在人們的印象里,AI都是一個(gè)屬于“大多數(shù)”的技術(shù)門類。

所謂大多數(shù),第一意味著相關(guān)數(shù)據(jù)量大、便于累積,適用于AI對(duì)海量數(shù)據(jù)極度依賴的特性;第二意味著應(yīng)用場(chǎng)景廣泛、便于變現(xiàn)回收成本,適用于AI研發(fā)的高門檻投入。

目前我們身邊常常出現(xiàn)的人臉識(shí)別、語(yǔ)音交互等等,其實(shí)都符合以上這些特征。不過(guò)這并不意味著,屬于“少數(shù)派”的AI是一片空白。

在“全球無(wú)障礙宣傳日”這個(gè)特別的日子,我們不如把目光投向于那些能夠消弭“少數(shù)與多數(shù)”區(qū)別的技術(shù)發(fā)展,例如服務(wù)于聽障人群的手語(yǔ)識(shí)別,就是一個(gè)典型的例子。

你我不懂的手語(yǔ),

為什么AI也很難讀懂?

手語(yǔ)是用手勢(shì)比量動(dòng)作,根據(jù)手勢(shì)的變化模擬形象或者音節(jié)以構(gòu)成的一定意思或詞語(yǔ),是聽障人群獨(dú)有的一種溝通方式。但這種溝通方式雖然能讓聽障人士之間彼此溝通,或讓理解手語(yǔ)的普通人與之溝通,但仍然不能滿足聽障人士與普羅大眾之間的交流需求。

這便意味著在一些社會(huì)公共空間之中,例如政務(wù)場(chǎng)景或服務(wù)業(yè)場(chǎng)景,聽障人士可能都會(huì)遇到一些不便。

而AI,恰好成為了一種解決方案。

我們?cè)谝恍┸浖?,已?jīng)開始應(yīng)用到了AI的手勢(shì)識(shí)別能力,像是拍照時(shí)“比心”來(lái)觸發(fā)一些AR特效。將這種對(duì)于手勢(shì)的捕捉,和手勢(shì)語(yǔ)義對(duì)應(yīng)起來(lái),不就能實(shí)現(xiàn)對(duì)于手語(yǔ)的翻譯和生成了嗎?

這一邏輯是正確的,可從邏輯正確到應(yīng)用可行,卻還隔著一段不短的路程。

首先,手語(yǔ)的表達(dá)有一定的特殊性,想進(jìn)行捕捉并不容易。

我們知道在“比劃手勢(shì)”這種行為上,本來(lái)就不存在絕對(duì)的精準(zhǔn)度,加之一些手語(yǔ)詞匯的表達(dá)非常接近,而且手語(yǔ)表達(dá)通常是以句子為單位,詞與詞之前不會(huì)有明顯的間隙。以往手勢(shì)識(shí)別中利用前置攝像頭捕捉的方式,基本是不可行的。

于是很多科技和團(tuán)隊(duì)給出的解決方案是加以外設(shè),例如中科大和微軟推出了基于Kinect的手語(yǔ)翻譯系統(tǒng),加州大學(xué)曾經(jīng)推出過(guò)的手語(yǔ)識(shí)別手套等等就是這樣??蛇@些外設(shè)要么便攜程度低,要么造價(jià)昂貴,推廣起來(lái)有很大的困難。

同時(shí),手語(yǔ)表達(dá)同樣也有國(guó)別性和地域性,在模型通用性上存在著困難。

手語(yǔ)中有“文法手語(yǔ)”和“自然手語(yǔ)”兩個(gè)概念,文法手語(yǔ)既是通用的普通話,至于自然手語(yǔ)則如同方言一般,在國(guó)別、地方甚至城市之間都有著不小的差異。這也造成了手語(yǔ)數(shù)據(jù)收集、標(biāo)注會(huì)是一項(xiàng)成本高、工作量大的事情。

例如亞馬遜曾經(jīng)提出過(guò),對(duì)智能音箱Alex進(jìn)行改造可以使其翻譯出一些簡(jiǎn)單的信號(hào)??墒且?yàn)槿狈Υ笠?guī)模的訓(xùn)練數(shù)據(jù)集,目前這一功能只能識(shí)別出一些簡(jiǎn)單的美國(guó)手語(yǔ),停留在實(shí)驗(yàn)室階段。

手語(yǔ)破題沒(méi)有秘法:

騰訊優(yōu)圖的平權(quán)精神

雖然探索艱難,但科技企業(yè)們還是不斷在手語(yǔ)AI上取得成果。

例如騰訊優(yōu)圖實(shí)驗(yàn)室在今天推出聯(lián)合深圳市信息無(wú)障礙研究會(huì)發(fā)布的“優(yōu)圖AI手語(yǔ)翻譯機(jī)”,就在手語(yǔ)AI的應(yīng)用上邁出了跨越性的一步。

優(yōu)圖AI手語(yǔ)翻譯機(jī)的突破性意味存在于兩方面,一方面是手語(yǔ)AI本身技術(shù)的進(jìn)展,另一方面是應(yīng)用場(chǎng)景的突破。

在手語(yǔ)AI技術(shù)本身上,可以分為識(shí)別模型和數(shù)據(jù)集兩個(gè)解決路徑。在數(shù)據(jù)集上,優(yōu)圖通過(guò)和社會(huì)相關(guān)機(jī)構(gòu)以及聽障人士的接觸自建了手語(yǔ)識(shí)別數(shù)據(jù)集,目前這一數(shù)據(jù)集已經(jīng)實(shí)現(xiàn)了近千句日常表達(dá)和900個(gè)常用詞匯的覆蓋,是當(dāng)前規(guī)模最大的中文手語(yǔ)識(shí)別數(shù)據(jù)集。而且這一數(shù)據(jù)集針對(duì)手語(yǔ)表達(dá)的地方性差異,做出了表達(dá)習(xí)慣和速度上的多樣性拓展。

至于識(shí)別模型上,優(yōu)圖也提出了一些更新的算法搭建概念,例如通過(guò)2D卷積神經(jīng)網(wǎng)絡(luò)和3D卷積神經(jīng)網(wǎng)絡(luò)分別提取手勢(shì)中靜態(tài)和動(dòng)態(tài)的信息,經(jīng)由綜合處理來(lái)提升視頻識(shí)別效果,徹底擺脫其他傳感器的桎梏。同時(shí)針對(duì)手語(yǔ)表達(dá)的整句化的現(xiàn)象,優(yōu)圖在視頻幀的最后加入了詞級(jí)信息挖掘,對(duì)特征提取器提出的信息進(jìn)行核驗(yàn),進(jìn)一步去確定手勢(shì)對(duì)詞語(yǔ)表達(dá)邊界,除了提升識(shí)別精準(zhǔn)度以外,還能提升對(duì)自然手語(yǔ)中地域表達(dá)的總結(jié)能力。在此基礎(chǔ)上,優(yōu)圖還在算法模型中引入了上下文理解能力,以便于面對(duì)更加復(fù)雜的手語(yǔ)識(shí)別翻譯需求。

不過(guò)技術(shù)雖然得以提升,應(yīng)用場(chǎng)景端仍然會(huì)受到一些限制。

由于高精度算法對(duì)于算力的要求較高,目前優(yōu)圖AI手語(yǔ)翻譯機(jī)還需要依賴于高性能計(jì)算機(jī)的后臺(tái)運(yùn)算;且因?yàn)橥ㄟ^(guò)圖像視頻進(jìn)行識(shí)別,對(duì)于復(fù)雜場(chǎng)景的辨識(shí)度還不高,因此優(yōu)圖AI手語(yǔ)翻譯機(jī)的應(yīng)用規(guī)劃,是應(yīng)用于探索在機(jī)場(chǎng)、高鐵、民政等公共服務(wù)場(chǎng)所之中,來(lái)彌補(bǔ)由于手語(yǔ)的低普及程度,聽障人士在這些場(chǎng)所里遇到的交流障礙,以技術(shù)協(xié)助共建一個(gè)信息無(wú)障礙的城市。

其實(shí)我們不難發(fā)現(xiàn),優(yōu)圖實(shí)驗(yàn)室的優(yōu)圖AI手語(yǔ)翻譯機(jī)雖然在手語(yǔ)翻譯準(zhǔn)確率上大大提高,也為AI手語(yǔ)翻譯找到了可行的應(yīng)用方案,可如果將技術(shù)拆分來(lái)看就能發(fā)現(xiàn),優(yōu)圖AI手語(yǔ)翻譯機(jī)技術(shù)突破原因,并不是在某項(xiàng)基礎(chǔ)科學(xué)上突然取得了什么驚人的突破,而是在研發(fā)和數(shù)據(jù)累積上一貫長(zhǎng)期的投入,才能解脫于以往手語(yǔ)語(yǔ)料庫(kù)匱乏的困境,在算法上不斷迭代。

換句話說(shuō),騰訊在“少數(shù)派”的AI技術(shù)中投入了幾乎與“大多數(shù)”AI技術(shù)相匹配的精力與財(cái)力。對(duì)于AI產(chǎn)業(yè)來(lái)說(shuō),這無(wú)疑是一種平權(quán)精神。

從以人為本到科技向善:

我們?yōu)楹我獙?duì)技術(shù)洋流的

引導(dǎo)更加主動(dòng)?

騰訊這種看似“逆勢(shì)而行”的做法,其實(shí)也是AI產(chǎn)業(yè)中一種隱隱冒出勢(shì)頭的洋流方向。

幾天以前,在福州的數(shù)字中國(guó)峰會(huì)上,馬化騰首次提到了“科技向善”這一概念,提出“我們希望‘科技向善’成為未來(lái)騰訊愿景與使命的一部分。我們相信,科技能夠造福人類;人類應(yīng)該善用科技,避免濫用,杜絕惡用;科技應(yīng)該努力去解決自身發(fā)展帶來(lái)的社會(huì)問(wèn)題。”

無(wú)獨(dú)有偶,李飛飛在回歸斯坦福后,就著手創(chuàng)辦了HAI研究所(以人為本斯坦福人工智能研究所),并在今年開始擔(dān)任所長(zhǎng)。HAI的研究目標(biāo),就是推動(dòng)AI技術(shù)向造福人類的方向發(fā)展,預(yù)測(cè)AI對(duì)人類生活的切實(shí)影響。

科技巨頭和學(xué)界旗幟都將目光投向了同一方向,是因?yàn)槿藗円呀?jīng)開始逐漸發(fā)現(xiàn)AI、5G、產(chǎn)業(yè)數(shù)字化等等技術(shù)力量的勢(shì)頭之強(qiáng),已經(jīng)到了不得不對(duì)其加以引導(dǎo)甚至約束的地步。

如同上文所說(shuō),科技企業(yè)在這一波技術(shù)發(fā)展的過(guò)程中,起到了很大的促進(jìn)作用,而逐利自然是企業(yè)的本能和天性,因此企業(yè)會(huì)率先投身于那些滿足大多數(shù)人、應(yīng)用場(chǎng)景廣泛、研發(fā)成本相對(duì)低的技術(shù)。

這種行為本身無(wú)可厚非,但AI等等新技術(shù)帶來(lái)的效率提升實(shí)在過(guò)于顯著,是否會(huì)會(huì)對(duì)那些暫時(shí)無(wú)法接入新技術(shù)的領(lǐng)域和群體進(jìn)行擠壓甚至邊緣化,是很多人都在思考的一個(gè)問(wèn)題。

例如隨著英漢日法俄等等主流語(yǔ)種的機(jī)器翻譯能力不斷增強(qiáng),那些語(yǔ)料庫(kù)不充足、應(yīng)用人數(shù)更少的小語(yǔ)種是否會(huì)因?yàn)榈貌坏郊夹g(shù)賦能,而被進(jìn)一步地邊緣化?

同樣的,當(dāng)公共事務(wù)辦理越來(lái)越多的被語(yǔ)音交互、圖像識(shí)別等等AI技術(shù)替代,聽障、視障群體在獲取服務(wù)時(shí)會(huì)不會(huì)遇到更多麻煩?

類似的情況其實(shí)已經(jīng)發(fā)生:2018年年底,聯(lián)合國(guó)發(fā)布了對(duì)英國(guó)政府?dāng)?shù)字化成果的報(bào)告,結(jié)果是數(shù)據(jù)顯示在英格蘭,自2010年以來(lái)無(wú)家可歸者增加了60%,保障住房的等待名單上有120萬(wàn)人,用來(lái)救濟(jì)窮人的食品銀行需求量增長(zhǎng)了近四倍——因?yàn)楹芏嘭毨巳翰⒉恢廊绾卧诨ヂ?lián)網(wǎng)上申請(qǐng)貧困補(bǔ)助,甚至家里都沒(méi)辦法連接互聯(lián)網(wǎng),最終只能在貧困中越陷越深。

很多時(shí)候,即使是無(wú)惡意的技術(shù),也可能會(huì)出現(xiàn)無(wú)法預(yù)測(cè)走向。我們對(duì)于科技向善的引導(dǎo),或許應(yīng)該更主動(dòng)一些。

結(jié)束語(yǔ)

最后,我們不如來(lái)看看這樣一組數(shù)字:

據(jù)2017年北京聽力協(xié)會(huì)預(yù)估數(shù)據(jù),我國(guó)聽障人群數(shù)量約達(dá)到7200萬(wàn)。在全球范圍內(nèi),世界衛(wèi)生組織發(fā)布的最新數(shù)據(jù)顯示,全世界有共計(jì)約4.66億人患有殘疾性聽力損失。

——你看,這世界上所謂“大多數(shù)”和“少數(shù)派”本來(lái)就是一個(gè)相對(duì)性的概念,并不存在黑白鮮明的區(qū)隔。尤其對(duì)于AI這種善于模仿人類能力的技術(shù)來(lái)說(shuō),它的存在本可以推倒阻礙各個(gè)群體溝通交流的空氣壁,而不是讓這種趨勢(shì)愈演愈烈。我們關(guān)于利用技術(shù)搭建美好世界的目標(biāo),既然可以不拋下任何一個(gè)人,就不該拋下任何一個(gè)人。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

慕尼黑2025年9月11日 /美通社/ -- 高端智能電動(dòng)汽車品牌問(wèn)界(AITO)在2025年德國(guó)國(guó)際汽車及智慧出行博覽會(huì)(IAA MOBILITY)上,正式發(fā)布了其最新全球產(chǎn)品陣容——專為中東市場(chǎng)深度本地化打造的AIT...

關(guān)鍵字: AI 智能駕駛 測(cè)試 生態(tài)系統(tǒng)

拉斯維加斯2025年9月11日 /美通社/ -- 在9月8日至11日舉辦的RE+ 2025展會(huì)上,全球綜合儲(chǔ)能解決方案供應(yīng)商德賽電池(Desay Battery)全面展示了其創(chuàng)新成果,并宣布與深圳市華寶新能源股份有限公司...

關(guān)鍵字: 電池 電芯 人工智能 鋰電

香港2025年 9月12日 /美通社/ -- 全球領(lǐng)先的互聯(lián)網(wǎng)社區(qū)創(chuàng)建者 - 網(wǎng)龍網(wǎng)絡(luò)控股有限公司 ("網(wǎng)龍"或"本公司",香港交易所股票代碼:777)欣然宣布,其子公司My...

關(guān)鍵字: AI 遠(yuǎn)程控制 控制技術(shù) BSP

AI賦能制造,黃埔匯聚全球新機(jī)遇 廣州2025年9月11日 /美通社/ -- 2025年9月10日,由廣州開發(fā)區(qū)投資集團(tuán)有限公司、廣州開發(fā)區(qū)黃埔區(qū)具身智能機(jī)器人產(chǎn)業(yè)發(fā)展促進(jìn)會(huì)、華南美國(guó)商會(huì)共同主辦的"2025...

關(guān)鍵字: 智能制造 AI 人工智能 供應(yīng)鏈

香港2025年9月11日 /美通社/ -- 華欽科技集團(tuán)(納斯達(dá)克代碼:CLPS,以下簡(jiǎn)稱"華欽科技"或"集團(tuán)")近日宣布成功利用人工智能(AI),包括微軟Copilot等客戶指定AI模型,完成對(duì)一家香港大型銀行30年歷...

關(guān)鍵字: 人工智能 PS REACT 測(cè)試

天津2025年9月11日 /美通社/ -- 國(guó)際能源署(IEA)數(shù)據(jù)顯示,2024 年全球數(shù)據(jù)中心電力消耗達(dá) 415 太瓦時(shí),占全球總用電量的 1.5%,預(yù)計(jì)到 2030 年,這一數(shù)字將飆升至 945 太瓦時(shí),近乎翻番,...

關(guān)鍵字: 模型 AI 數(shù)據(jù)中心 BSP

深圳2025年9月11日 /美通社/ -- 近日,德國(guó)柏林國(guó)際電子消費(fèi)品展覽會(huì)(簡(jiǎn)稱IFA)期間,國(guó)際公認(rèn)的測(cè)試、檢驗(yàn)和認(rèn)證機(jī)構(gòu)SGS為極殼(Hypershell) 全球首款戶外動(dòng)力外骨骼產(chǎn)品Hypershell X 系...

關(guān)鍵字: SHELL RS AI SI

近日,一則關(guān)于 AI 算力領(lǐng)域的消息引發(fā)行業(yè)震動(dòng)!據(jù)科技網(wǎng)站 The Information 援引四位知情人士爆料,中國(guó)科技巨頭阿里巴巴與百度已正式將自研芯片應(yīng)用于 AI 大模型訓(xùn)練,打破了此前對(duì)英偉達(dá)芯片的單一依賴。

關(guān)鍵字: AI 算力 阿里 百度 芯片 AI模型

2025年9月11日,中國(guó)上海 — 思特威(上海)電子科技股份有限公司(股票簡(jiǎn)稱:思特威,股票代碼:688213)近日宣布,全新推出5000萬(wàn)像素0.7μm像素尺寸手機(jī)應(yīng)用CMOS圖像傳感器——SC535XS。SC535...

關(guān)鍵字: CMOS圖像傳感器 手機(jī) AI
關(guān)閉