www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁(yè) > 物聯(lián)網(wǎng) > 智能應(yīng)用
[導(dǎo)讀]大型語(yǔ)言模型(LLMS)以其產(chǎn)生連貫的文本,翻譯語(yǔ)言甚至進(jìn)行對(duì)話的能力而破壞了AI。但是,盡管具有令人印象深刻的能力,但在推理和理解復(fù)雜環(huán)境方面,LLM仍然面臨重大挑戰(zhàn)。

大型語(yǔ)言模型(LLMS)以其產(chǎn)生連貫的文本,翻譯語(yǔ)言甚至進(jìn)行對(duì)話的能力而破壞了AI。但是,盡管具有令人印象深刻的能力,但在推理和理解復(fù)雜環(huán)境方面,LLM仍然面臨重大挑戰(zhàn)。

這些模型雖然善于識(shí)別和復(fù)制大量培訓(xùn)文本的模式,但經(jīng)常在需要真正理解和邏輯推理的任務(wù)上掙扎。這可能會(huì)導(dǎo)致諸如長(zhǎng)時(shí)間對(duì)話中的不一致之處,連接不同信息的錯(cuò)誤以及在維持有關(guān)擴(kuò)展敘述的上下文時(shí)遇到的困難。了解這些推理問(wèn)題對(duì)于改善LLM的未來(lái)發(fā)展和應(yīng)用至關(guān)重要。

關(guān)鍵推理挑戰(zhàn)

缺乏真正的理解

語(yǔ)言模型通過(guò)根據(jù)他們?cè)谂嘤?xùn)期間從廣泛的數(shù)據(jù)中學(xué)到的模式來(lái)預(yù)測(cè)下一個(gè)關(guān)鍵字來(lái)運(yùn)行。但是,他們?nèi)狈?duì)環(huán)境和討論的概念的深刻,內(nèi)在的理解。結(jié)果,他們可能會(huì)發(fā)現(xiàn)需要真正理解挑戰(zhàn)的復(fù)雜推理任務(wù)。

上下文限制

盡管現(xiàn)代語(yǔ)言模型在掌握短篇小說(shuō)方面表現(xiàn)出色,但它們通常很難在擴(kuò)展的對(duì)話或更大的文本段上保持連貫性和背景。當(dāng)模型必須從對(duì)話或文本的各個(gè)部分鏈接信息時(shí),這可能會(huì)導(dǎo)致推理錯(cuò)誤。在漫長(zhǎng)的討論或復(fù)雜的敘述中,該模型可能會(huì)忘記或誤解早期的細(xì)節(jié),從而導(dǎo)致矛盾或不準(zhǔn)確的結(jié)論。

無(wú)法執(zhí)行計(jì)劃

許多推理任務(wù)涉及邏輯的多個(gè)步驟或隨著時(shí)間的推移跟蹤許多事實(shí)的能力。當(dāng)前的語(yǔ)言模型通常在需要長(zhǎng)期連貫性或多步邏輯推論的任務(wù)上掙扎。他們可能難以解決需要多個(gè)邏輯操作的難題。

回答無(wú)法解決的問(wèn)題

回答無(wú)法解決的問(wèn)題是LLM的一個(gè)關(guān)鍵挑戰(zhàn),并突出了其推理能力的局限性。當(dāng)提出一個(gè)無(wú)法解決的問(wèn)題時(shí),例如悖論,沒(méi)有明確答案的問(wèn)題,或與已建立的事實(shí)相矛盾的問(wèn)題時(shí),LLM可能會(huì)難以提供有意義或連貫的回答。該模型不能意識(shí)到問(wèn)題的固有不可能,而是嘗試根據(jù)已經(jīng)訓(xùn)練的數(shù)據(jù)中的模式提供解決方案,這可能會(huì)導(dǎo)致誤導(dǎo)或錯(cuò)誤的答案。

國(guó)家空間計(jì)算復(fù)雜性

一些問(wèn)題需要探索從初始狀態(tài)到目標(biāo)狀態(tài)的所有可能狀態(tài)。例如,旅行計(jì)劃可能涉及許多選擇,并且有了其他限制,例如預(yù)算和旅行方式,搜索狀態(tài)空間可以接近多項(xiàng)式爆炸。語(yǔ)言模型計(jì)算和響應(yīng)所有這些可能性是不切實(shí)際的。取而代之的是,它將依靠它所學(xué)會(huì)的啟發(fā)式方法提供可能是不正確的可行解決方案。

不正確推理的真實(shí)示例

讓我們提出一個(gè)問(wèn)題:

純文本

1

“一個(gè)裝滿了8個(gè)水的水罐,還有兩個(gè)空尺寸5和5的空壺。

2

求解器必須倒入水,以使第一壺和第二壺都包含4個(gè)單元,而第三壺則是空的。

3

當(dāng)源壺為空或目的地水罐已滿,以先到者為準(zhǔn)時(shí),每個(gè)步驟將水從源果罐倒入目的地水罐停止。

從下面的回答中,我們可以看到,今天存在的LLM給出了錯(cuò)誤的答案。這個(gè)問(wèn)題實(shí)際上是無(wú)法解決的,但是所有LLM都試圖給出一個(gè)答案,就好像他們找到了解決方案一樣。

Chatgpt的回應(yīng)

Google的回應(yīng)

Bing Copilot的回應(yīng)

LLMS背誦與推理

但是,如果您要將問(wèn)題更改為“兩個(gè)空的尺寸為5和4”,而不是“兩個(gè)空的尺寸5和5”,那么所有LLM都會(huì)正確回答記憶的問(wèn)題。

研究人員建議什么來(lái)幫助推理?

一些研究人員專(zhuān)注于改進(jìn)數(shù)據(jù)集并使用思想鏈方法,而另一些研究人員則建議使用外部驗(yàn)證者和求解器。這些技術(shù)中的每一個(gè)旨在通過(guò)解決問(wèn)題的不同維度來(lái)帶來(lái)改進(jìn)。

改進(jìn)數(shù)據(jù)集

一些研究人員建議提高用于培訓(xùn)語(yǔ)言模型的數(shù)據(jù)的質(zhì)量和多樣性。通過(guò)策劃更全面和多樣化的數(shù)據(jù)集,模型可以從更廣泛的上下文和示例中學(xué)習(xí)。這種方法旨在提高模型處理各種情況的能力。

經(jīng)過(guò)思考鏈

該技術(shù)涉及培訓(xùn)模型遵循結(jié)構(gòu)化的推理過(guò)程,類(lèi)似于人類(lèi)思維。通過(guò)鼓勵(lì)模型明確地生成中間的推理步驟,研究人員希望提高模型處理復(fù)雜的推理任務(wù)并提供更準(zhǔn)確,邏輯上一致的響應(yīng)的能力。

使用外部驗(yàn)證器

為了解決產(chǎn)生錯(cuò)誤或誤導(dǎo)性信息的模型問(wèn)題,一些研究人員提出了整合外部驗(yàn)證機(jī)制。這些驗(yàn)證者可以針對(duì)受信任的來(lái)源進(jìn)行跨檢查模型的輸出,或者在向用戶提交信息之前,使用其他算法來(lái)驗(yàn)證信息的準(zhǔn)確性。這有助于確保生成的內(nèi)容可靠并且實(shí)際上是正確的。

使用求解器

另一種方法涉及合并旨在處理特定類(lèi)型推理任務(wù)的專(zhuān)業(yè)求解器。這些求解器可用于執(zhí)行計(jì)算,求解方程或過(guò)程邏輯語(yǔ)句,以補(bǔ)充語(yǔ)言模型的功能。通過(guò)將這些任務(wù)委派給求解器,總體系統(tǒng)可以實(shí)現(xiàn)更準(zhǔn)確和可靠的結(jié)果。

結(jié)論

盡管在文本生成和理解等領(lǐng)域取得了令人印象深刻的進(jìn)步,但當(dāng)前的語(yǔ)言模型由于無(wú)法完全掌握含義,保持一致的環(huán)境并僅依靠大型但潛在有缺陷的培訓(xùn)數(shù)據(jù)提取的模式而在復(fù)雜的多層推理任務(wù)中掙扎,因此它們的多層推理任務(wù)掙扎。為了解決這些限制,未來(lái)的模型可能需要更復(fù)雜的體系結(jié)構(gòu),以及正在進(jìn)行的常識(shí)推理研究。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉