人工智能如何使Web更易于訪問(wèn)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
谷歌于2019年推出了Lookout應(yīng)用,通過(guò)圖像處理和機(jī)器學(xué)習(xí)相結(jié)合,幫助盲人了解他們的環(huán)境。這是朝著正確方向邁出的一步,應(yīng)該指出其他企業(yè)從道德和商業(yè)角度做正確的事情。畢竟,每天在互聯(lián)網(wǎng)上共享32億張圖像。沒(méi)有AI的幫助,殘疾人將無(wú)法知道這些圖片的內(nèi)容。
Facebook是第一個(gè)通過(guò)推出革命性的自動(dòng)替代文字功能來(lái)解決這個(gè)問(wèn)題的社交媒體巨頭,能夠向視障人士和盲人動(dòng)態(tài)描述圖像。使用神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí),F(xiàn)acebook可以識(shí)別圖像中的不同組件,并以驚人的準(zhǔn)確度描述每個(gè)組件。再過(guò)五到七年,圖像識(shí)別軟件將使alt文本過(guò)時(shí)。已經(jīng)在各個(gè)領(lǐng)域?qū)嵤┝藞D像識(shí)別,并取得了顯著的成功。大型數(shù)據(jù)庫(kù)和可視化站點(diǎn)將其用于自動(dòng)化圖像組織,而營(yíng)銷人員依靠該技術(shù)創(chuàng)建交互式品牌活動(dòng)。
在殘疾人的要求的推動(dòng)下,人工智能構(gòu)建模塊現(xiàn)在正在組裝,以創(chuàng)建復(fù)雜,創(chuàng)造性的服務(wù),可以改善他們的生活并代表他們完成任務(wù)。了解這些構(gòu)建模塊如何克服殘疾挑戰(zhàn),并有助于提高在線體驗(yàn)的可訪問(wèn)性:accessiBe是一款基于人工智能的開創(chuàng)性網(wǎng)絡(luò)輔助功能工具,可簡(jiǎn)化網(wǎng)站所有者和公司如何使殘障用戶可以訪問(wèn)其內(nèi)容。它可以為您的所有網(wǎng)站圖像自動(dòng)和批量創(chuàng)建準(zhǔn)確的替代文字說(shuō)明,使其可供視障人士使用。
最重要的是,accessiBe的后臺(tái)應(yīng)用程序確保該站點(diǎn)的基礎(chǔ)架構(gòu)符合整個(gè)WCAG 2.1,這是Web可訪問(wèn)性法規(guī)的標(biāo)準(zhǔn):?jiǎn)⒂脝螕暨x項(xiàng)可為癲癇患者禁用動(dòng)畫/閃爍等針對(duì)有運(yùn)動(dòng)障礙的人優(yōu)化網(wǎng)站以進(jìn)行鍵盤導(dǎo)航提供內(nèi)置字典,解釋有認(rèn)知障礙的人的表情,俚語(yǔ)和短語(yǔ)。對(duì)顏色,字體和排版進(jìn)行細(xì)粒度調(diào)整,以使視障人士可以訪問(wèn)內(nèi)容基于面部識(shí)別的CAPTCHA錄入。
面部識(shí)別對(duì)于殘疾人來(lái)說(shuō)是一種福音。但它并非缺乏隱私或安全問(wèn)題。通過(guò)分析數(shù)據(jù) - 通常,從不同角度拍攝一張人臉的大量照片 - 人工智能可以假設(shè)誰(shuí)在鏡頭前。這可以證明在克服與各種環(huán)境中的在線認(rèn)證相關(guān)的挑戰(zhàn)方面是有用的。蘋果公司在2017年使用面部識(shí)別技術(shù)解鎖iPhone,而微軟擁有其專有的Hello軟件。這兩種技術(shù)都允許用戶僅使用他們的面部登錄。無(wú)需密碼。
盡管存在安全漏洞和限制,面部識(shí)別仍然會(huì)推翻傳統(tǒng)的CAPTCHA測(cè)試,尤其是隨著互聯(lián)網(wǎng)越來(lái)越容易被殘疾人使用。一旦系統(tǒng)識(shí)別出通過(guò)相機(jī)鏡頭與之交互的人,它就可以在平整比賽場(chǎng)地的同時(shí)有效地清除機(jī)器人。
研究人員在2018年提出了深度視頻肖像的想法,它使用人工智能編輯演員的面部表情,以便精確匹配配音,從而節(jié)省時(shí)間并降低電影業(yè)的成本。該軟件的應(yīng)用還可以糾正視頻會(huì)議中的頭部姿勢(shì)和凝視,并允許新的視覺(jué)和后期制作效果。像這樣的人工智能技術(shù)很快就會(huì)使狡猾的字幕成為過(guò)去,讓聽(tīng)障人士可以在線欣賞視頻內(nèi)容。將該計(jì)劃整合到手機(jī)中將允許聽(tīng)力受損的個(gè)人解釋其他人的言論。
Google DeepMind研究了來(lái)自各種BBC視頻的超過(guò)100,000個(gè)自然語(yǔ)句,涵蓋了各種口音,頭部位置,燈光,語(yǔ)速和語(yǔ)言。他們針對(duì)Google DeepMind的神經(jīng)網(wǎng)絡(luò)運(yùn)行這些視頻,結(jié)果令人驚訝。雖然最好的唇讀專業(yè)人員僅解釋了12.4%的內(nèi)容,但人工智能的準(zhǔn)確率達(dá)到了驚人的46.8%??紤]一下這種技術(shù)對(duì)聽(tīng)力問(wèn)題患者生活的影響。他們不僅可以使用在線視頻,而且自動(dòng)字幕的質(zhì)量和相關(guān)性也會(huì)提高。
想一想 - 每天生成2.5個(gè)五分之一字節(jié)的數(shù)據(jù),這可能會(huì)增加。這使得自動(dòng)總結(jié)內(nèi)容成為一項(xiàng)嚴(yán)峻的挑戰(zhàn)。對(duì)于識(shí)字能力低的人來(lái)說(shuō),情況要困難得多。長(zhǎng)篇新聞文章,對(duì)話和文檔的摘要可以更快,更有效地消費(fèi)。現(xiàn)在,在AI的幫助下,這是可能的。自動(dòng)文本摘要可以包含各種各樣的實(shí)際應(yīng)用程序,包括媒體監(jiān)控,營(yíng)銷,研究和分析。
例如,Salesforce 在2017年開發(fā)了一種摘要算法。利用機(jī)器學(xué)習(xí)生成較短的文本摘要,該功能可以幫助人們解決記憶問(wèn)題,注意力缺陷障礙和學(xué)習(xí)障礙,如閱讀障礙。該公司現(xiàn)在已經(jīng)從一個(gè)提取模型變?yōu)槌橄竽P?,引入了新的相關(guān)同義詞和單詞并總結(jié)了文本。全世界大量的文化和語(yǔ)言可以在線呈現(xiàn)各種溝通問(wèn)題。這就是為什么廣泛的研究進(jìn)入建立系統(tǒng),使人們能夠溝通沒(méi)有任何語(yǔ)言障礙。
想想谷歌翻譯。當(dāng)然,早期的翻譯充滿了不一致和錯(cuò)誤。但是,當(dāng)Google推出神經(jīng)機(jī)器翻譯系統(tǒng)時(shí),所有這些都在2016年11月發(fā)生了變化,將錯(cuò)誤率降低了85%。GNMT還推廣了全球運(yùn)營(yíng)翻譯的理念,這些翻譯以每句話句子,每個(gè)想法為基礎(chǔ)進(jìn)行操作。隨著人工智能獲得更多的特定語(yǔ)言,它可以學(xué)到更多并生成準(zhǔn)確的翻譯。
所有這些都在2017年發(fā)布Google Pixel Buds時(shí)達(dá)到了頂峰。耳塞與公司的像素手機(jī)配合使用,可以自動(dòng)翻譯用戶聽(tīng)到的內(nèi)容。該技術(shù)實(shí)時(shí)工作,支持近40種不同的語(yǔ)言。這對(duì)于減少殘疾人的溝通障礙大有幫助。
人工智能技術(shù)的使用為殘疾人提供了新的機(jī)會(huì)。它不僅使互聯(lián)網(wǎng)成為一個(gè)更容易獲得的空間,而且還可以提供更多的工作場(chǎng)所支持。企業(yè)必須了解人工智能的發(fā)展,如果他們希望避免訴訟,那么殘疾員工可以使用工作場(chǎng)所。人工智能的進(jìn)步將幫助企業(yè)履行法律義務(wù)并支持多元化的用戶群。但是,隨著時(shí)間的推移,必須培養(yǎng)易用性和對(duì)AI的信任。到那時(shí),互聯(lián)網(wǎng)需要盡一切努力為所有用戶建立一個(gè)包容和可訪問(wèn)的環(huán)境,無(wú)論是殘疾人還是非殘疾人。