當(dāng)前位置：首頁(yè) > 公眾號(hào)精選 > AI科技大本營(yíng)

麻省理工最新成果：AI?揭示人腦如何處理語(yǔ)言

時(shí)間：2021-11-05 13:52:07

關(guān)鍵字： AI

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]作者|?青蘋(píng)果來(lái)源|數(shù)據(jù)實(shí)戰(zhàn)派在過(guò)去的幾年里，AI語(yǔ)言模型已經(jīng)可以非常出色的處理一些特定任務(wù)。其中，最值得注意的是，它們擅長(zhǎng)預(yù)測(cè)文本字符串中的下一個(gè)單詞。以搜索引擎和短信應(yīng)用為例，這項(xiàng)技術(shù)可以輔助它們進(jìn)行預(yù)測(cè)，以獲取你準(zhǔn)備輸入的下一個(gè)單詞。最新一代的預(yù)測(cè)語(yǔ)言模型似乎也學(xué)會(huì)了一些語(yǔ)...

作者 | 青蘋(píng)果
來(lái)源 | 數(shù)據(jù)實(shí)戰(zhàn)派在過(guò)去的幾年里，AI 語(yǔ)言模型已經(jīng)可以非常出色的處理一些特定任務(wù)。其中，最值得注意的是，它們擅長(zhǎng)預(yù)測(cè)文本字符串中的下一個(gè)單詞。以搜索引擎和短信應(yīng)用為例，這項(xiàng)技術(shù)可以輔助它們進(jìn)行預(yù)測(cè)，以獲取你準(zhǔn)備輸入的下一個(gè)單詞。
最新一代的預(yù)測(cè)語(yǔ)言模型似乎也學(xué)會(huì)了一些語(yǔ)言的潛在含義。讓人驚嘆的是，這些模型不僅可以預(yù)測(cè)下一個(gè)單詞，還可以執(zhí)行似乎需要一定理解才能完成的任務(wù)，如問(wèn)答、文檔摘要和故事續(xù)寫(xiě)。
這些模型旨在優(yōu)化預(yù)測(cè)文本的特定功能，而非試圖模仿人類大腦如何執(zhí)行這項(xiàng)任務(wù)或理解語(yǔ)言。但 MIT 神經(jīng)科學(xué)家的一項(xiàng)新研究表明，這些模型的潛在功能類似于人類大腦中的語(yǔ)言處理中心的功能。
這篇論文寫(xiě)道：“我們的研究結(jié)果表明，預(yù)測(cè)性人工神經(jīng)網(wǎng)絡(luò)可作為預(yù)測(cè)語(yǔ)言處理如何在人類神經(jīng)組織中實(shí)施的可行候選假設(shè)。這些網(wǎng)絡(luò)為一個(gè)有前途的研究方向奠定了關(guān)鍵基礎(chǔ)，即在集成逆向工程的良性循環(huán)中將自然語(yǔ)言處理的高性能模型與人類語(yǔ)言理解的大規(guī)模神經(jīng)和行為測(cè)量相結(jié)合，包括測(cè)試模型預(yù)測(cè)神經(jīng)和行為的能力，剖析表現(xiàn)最佳的模型以了解哪些組件對(duì)高大腦預(yù)測(cè)性至關(guān)重要，利用這些知識(shí)開(kāi)發(fā)更好的模型，并收集新數(shù)據(jù)以挑戰(zhàn)和限制未來(lái)幾代神經(jīng)上合理的語(yǔ)言處理模型”。
在其他類型的語(yǔ)言任務(wù)中，表現(xiàn)良好的計(jì)算機(jī)模型并未展示出與人類大腦的這種相似性，這為人腦可能會(huì)使用下一個(gè)單詞預(yù)測(cè)來(lái)驅(qū)動(dòng)語(yǔ)言處理提供了證據(jù)。
認(rèn)知神經(jīng)科學(xué)的 Walter A. Rosenblith 教授 Nancy Kanwisher 說(shuō)，“模型預(yù)測(cè)下一個(gè)單詞的能力越強(qiáng)，就越符合人類的大腦”。他是 MIT 麥戈文腦科學(xué)研究所和大腦、心智和機(jī)器中心（CBMM, Brain Research and Center for Brains, Minds, and Machines）的成員，也是這項(xiàng)新研究的作者之一。
“令人驚訝的是，這些模型擬合得如此之好，這也有力地暗示出，也許人類語(yǔ)言系統(tǒng)正在做的就是預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么。”
該研究論文題為“The neural architecture of language: Integrative modeling converges on predictive processing”，已發(fā)表在 Proceedings of the National Academy of Sciences 上。
麻省理工最新成果：AI?揭示人腦如何處理語(yǔ)言

語(yǔ)言處理的人工神經(jīng)網(wǎng)絡(luò)模型與人類語(yǔ)言處理的比較。實(shí)驗(yàn)測(cè)試了不同模型的效果預(yù)測(cè)人類神經(jīng)活動(dòng)（fMRI 和 ECoG）的測(cè)量值和語(yǔ)言理解過(guò)程中的行為。候選模型范圍從簡(jiǎn)單將模型嵌入到更復(fù)雜的循環(huán)和變壓器網(wǎng)絡(luò)中。刺激范圍從句子到段落再到故事，并且被輸入到模型，以及呈現(xiàn)給人類參與者（視覺(jué)或聽(tīng)覺(jué)）。模型的內(nèi)部表征在三個(gè)主要維度上進(jìn)行評(píng)估：預(yù)測(cè)人類神經(jīng)表征的能力；以閱讀時(shí)間的形式預(yù)測(cè)人類行為的能力；執(zhí)行下一個(gè)詞預(yù)測(cè)等任務(wù)的計(jì)算能力。

做預(yù)測(cè)任務(wù)
這種新的、高性能的預(yù)測(cè)下一個(gè)單詞的模型屬于深度神經(jīng)網(wǎng)絡(luò)模型的范疇。這些網(wǎng)絡(luò)包含計(jì)算“節(jié)點(diǎn)”，它們形成不同強(qiáng)度的連接，以及以規(guī)定的方式在彼此之間傳遞信息的層。

在過(guò)去的十年里，科學(xué)家們用深度神經(jīng)網(wǎng)絡(luò)創(chuàng)建了視覺(jué)模型，可以像靈長(zhǎng)類大腦一樣識(shí)別物體。MIT 的研究也表明，視覺(jué)物體識(shí)別模型的潛在功能與靈長(zhǎng)類視覺(jué)皮層的組織相匹配，盡管這些計(jì)算機(jī)模型并不是專為模仿大腦而設(shè)計(jì)的。
在這項(xiàng)新研究中，MIT 研究團(tuán)隊(duì)采用了類似的方法，以比較人腦中的語(yǔ)言處理中心和語(yǔ)言處理模型。
他們分析了 43 種不同的語(yǔ)言模型，涵蓋一些對(duì)單詞進(jìn)行預(yù)測(cè)優(yōu)化的模型。其中包括 GPT-3（生成式預(yù)訓(xùn)練 Transformer 3），它可以依據(jù)給出的提示，生成與人類手動(dòng)生成相類似的文本。而其他的模型則旨在執(zhí)行不同的語(yǔ)言任務(wù)，比如在句子中填空。
由于每個(gè)模型都有一串單詞，研究人員測(cè)量了構(gòu)成網(wǎng)絡(luò)節(jié)點(diǎn)的活動(dòng)。
然后者的然后，他們將這些模式與人類大腦中的活動(dòng)進(jìn)行了比較，并對(duì)執(zhí)行三種語(yǔ)言任務(wù)的受試者進(jìn)行了測(cè)量：聽(tīng)故事、一次讀一個(gè)句子，以及每次讀一個(gè)單詞的句子。這些人體數(shù)據(jù)集包括功能性磁共振成像（fMRI, functional magnetic resonance imaging）數(shù)據(jù)和接受癲癇腦手術(shù)患者的顱內(nèi)皮層腦電圖測(cè)量。
結(jié)果表明，性能最好的單詞預(yù)測(cè)模型的活動(dòng)模式與人腦中的活動(dòng)模式非常相似。這些相同模型中的活動(dòng)與人類行為指標(biāo)高度相關(guān)，例如，人們閱讀文本的速度。
Schrimpf 說(shuō)，“我們發(fā)現(xiàn)，能夠很好地預(yù)測(cè)神經(jīng)反應(yīng)的模型也傾向于以閱讀時(shí)間的形式最好地預(yù)測(cè)人類的行為反應(yīng)。然后通過(guò)下一個(gè)單詞預(yù)測(cè)的模型性能來(lái)解釋這兩個(gè)問(wèn)題。這個(gè)三角形真的把一切聯(lián)系在一起?！?/span>

改變游戲規(guī)則
預(yù)測(cè)模型（如 GPT-3）的關(guān)鍵計(jì)算特性之一，是一個(gè)稱為正向單向預(yù)測(cè) transformer 的元件。這種 transformer 能夠根據(jù)之前的序列預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么。它的顯著特征在于，可以基于文本中篇幅較大的上下文（數(shù)百個(gè)單詞）進(jìn)行預(yù)測(cè)，而不僅僅是最后幾個(gè)單詞。

Tenenbaum 說(shuō)，科學(xué)家還沒(méi)有發(fā)現(xiàn)任何與這種處理方式相對(duì)應(yīng)的大腦回路或?qū)W習(xí)機(jī)制。不過(guò)，新的發(fā)現(xiàn)與先前提出的假設(shè)保持著高度一致，即預(yù)測(cè)是語(yǔ)言處理的關(guān)鍵功能之一。
“語(yǔ)言處理的挑戰(zhàn)之一是它的實(shí)時(shí)性，”他強(qiáng)調(diào)到。“語(yǔ)言輸入進(jìn)來(lái)后，你必須跟上它的節(jié)奏，并且能夠?qū)崟r(shí)理解它的含義。”
研究人員現(xiàn)在計(jì)劃構(gòu)建這些語(yǔ)言處理模型的變體，以了解其結(jié)構(gòu)的微小變化是如何影響性能表現(xiàn)和適應(yīng)人類神經(jīng)數(shù)據(jù)的能力的。
“對(duì)我來(lái)說(shuō)，這個(gè)結(jié)果改變了游戲規(guī)則，” Fedorenko 說(shuō)道?！斑@完全改變了我的研究項(xiàng)目，因?yàn)槲覜](méi)有預(yù)料到，在我有生之年，會(huì)得到這些計(jì)算清晰的模型。這些模型能夠捕捉到足夠多的大腦信息，這樣我們就可以真正利用它們來(lái)理解大腦的工作原理?！?/span>
研究人員還計(jì)劃嘗試將這些高性能語(yǔ)言模型與 Tenenbaum 實(shí)驗(yàn)室先前開(kāi)發(fā)的一些計(jì)算機(jī)模型相結(jié)合，這些模型可以執(zhí)行一些其他類型的任務(wù)，比如，構(gòu)建物理世界的感知表征等。
麻省理工最新成果：AI?揭示人腦如何處理語(yǔ)言

上圖為該研究的主要結(jié)論，包括特定的 ANN 語(yǔ)言模型可以預(yù)測(cè)人類的神經(jīng)對(duì)語(yǔ)言輸入的高精度響應(yīng)。
Tenenbaum 說(shuō)，“如果我們能夠理解這些語(yǔ)言模型的作用，以及它們?nèi)绾闻c那些更像是做感知和思考的模型相聯(lián)系，那么，我們很可能會(huì)得到更多關(guān)于大腦如何工作的綜合性模型。這可能會(huì)讓我們構(gòu)建出更完善的、性能更佳的 AI 模型。當(dāng)然，我們也可以更多地了解大腦究竟如何工作，以及通用智能是如何出現(xiàn)的，以豐富過(guò)去的知識(shí)盲區(qū)。” 麻省理工最新成果：AI?揭示人腦如何處理語(yǔ)言

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

阿維塔、賽力斯已入股！華為引望可能成“中國(guó)博世”

9月2日消息，不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司，隨著阿維塔和賽力斯的入局，華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字：阿維塔塞力斯華為

[美通社全球TMT]

Trianz與AWS達(dá)成戰(zhàn)略合作協(xié)議，徹底改變?cè)撇捎煤凸芾矸绞?/a>

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布，該公司與Amazon Web Services （AWS）簽訂了...

關(guān)鍵字： AWS AN BSP 數(shù)字化

[美通社全球TMT]

人工智能驅(qū)動(dòng)工具SODA V將顛覆汽車市場(chǎng)，使汽車開(kāi)發(fā)時(shí)間和成本降低90%

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V，這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具，可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字：汽車人工智能智能驅(qū)動(dòng) BSP

[美通社全球TMT]

從容應(yīng)對(duì)未知風(fēng)險(xiǎn)----解密亞馬遜云科技的韌性之道

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行，同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn)，如企業(yè)系統(tǒng)復(fù)雜性的增加，頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性，提升韌性，成...

關(guān)鍵字：亞馬遜解密控制平面 BSP

[通信先鋒]

中國(guó)游戲市場(chǎng)開(kāi)始復(fù)蘇！騰訊、網(wǎng)易等巨頭縮減在日本投資

8月30日消息，據(jù)媒體報(bào)道，騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字：騰訊編碼器 CPU

[通信先鋒]

獨(dú)立自主！華為董事：致力打造不依賴西方的技術(shù)

8月28日消息，今天上午，2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行，華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字：華為 12nm EDA 半導(dǎo)體

[通信先鋒]

華為張平安：數(shù)字世界話語(yǔ)權(quán)最終由生態(tài)繁榮決定！

8月28日消息，在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上，華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱，數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字：華為 12nm 手機(jī) 衛(wèi)星通信

[美通社全球TMT]

中國(guó)通信服務(wù)公布2024年中期業(yè)績(jī)

要點(diǎn)：有效應(yīng)對(duì)環(huán)境變化，經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升落實(shí)提質(zhì)增效舉措，毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著，戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng)，提升企業(yè)核心競(jìng)爭(zhēng)力堅(jiān)持高質(zhì)量發(fā)展策略，塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字：通信 BSP 電信運(yùn)營(yíng)商數(shù)字經(jīng)濟(jì)

[美通社全球TMT]

NVI技術(shù)創(chuàng)新聯(lián)盟成立！自主生態(tài)將帶動(dòng)產(chǎn)業(yè)鏈高速發(fā)展

北京2024年8月27日 /美通社/ -- 8月21日，由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字： VI 傳輸協(xié)議音頻 BSP

[美通社全球TMT]

軟通動(dòng)力與長(zhǎng)三角投資達(dá)成戰(zhàn)略合作共謀數(shù)字生態(tài)新發(fā)展

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上，軟通動(dòng)力信息技術(shù)（集團(tuán)）股份有限公司（以下簡(jiǎn)稱"軟通動(dòng)力"）與長(zhǎng)三角投資（上海）有限...

關(guān)鍵字： BSP 信息技術(shù)