www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 物聯(lián)網(wǎng) > 智能應(yīng)用
[導(dǎo)讀]大型語言模型(LLMS)以其產(chǎn)生連貫的文本,翻譯語言甚至進行對話的能力而破壞了AI。但是,盡管具有令人印象深刻的能力,但在推理和理解復(fù)雜環(huán)境方面,LLM仍然面臨重大挑戰(zhàn)。

大型語言模型(LLMS)以其產(chǎn)生連貫的文本,翻譯語言甚至進行對話的能力而破壞了AI。但是,盡管具有令人印象深刻的能力,但在推理和理解復(fù)雜環(huán)境方面,LLM仍然面臨重大挑戰(zhàn)。

這些模型雖然善于識別和復(fù)制大量培訓(xùn)文本的模式,但經(jīng)常在需要真正理解和邏輯推理的任務(wù)上掙扎。這可能會導(dǎo)致諸如長時間對話中的不一致之處,連接不同信息的錯誤以及在維持有關(guān)擴展敘述的上下文時遇到的困難。了解這些推理問題對于改善LLM的未來發(fā)展和應(yīng)用至關(guān)重要。

關(guān)鍵推理挑戰(zhàn)

缺乏真正的理解

語言模型通過根據(jù)他們在培訓(xùn)期間從廣泛的數(shù)據(jù)中學(xué)到的模式來預(yù)測下一個關(guān)鍵字來運行。但是,他們?nèi)狈Νh(huán)境和討論的概念的深刻,內(nèi)在的理解。結(jié)果,他們可能會發(fā)現(xiàn)需要真正理解挑戰(zhàn)的復(fù)雜推理任務(wù)。

上下文限制

盡管現(xiàn)代語言模型在掌握短篇小說方面表現(xiàn)出色,但它們通常很難在擴展的對話或更大的文本段上保持連貫性和背景。當(dāng)模型必須從對話或文本的各個部分鏈接信息時,這可能會導(dǎo)致推理錯誤。在漫長的討論或復(fù)雜的敘述中,該模型可能會忘記或誤解早期的細節(jié),從而導(dǎo)致矛盾或不準(zhǔn)確的結(jié)論。

無法執(zhí)行計劃

許多推理任務(wù)涉及邏輯的多個步驟或隨著時間的推移跟蹤許多事實的能力。當(dāng)前的語言模型通常在需要長期連貫性或多步邏輯推論的任務(wù)上掙扎。他們可能難以解決需要多個邏輯操作的難題。

回答無法解決的問題

回答無法解決的問題是LLM的一個關(guān)鍵挑戰(zhàn),并突出了其推理能力的局限性。當(dāng)提出一個無法解決的問題時,例如悖論,沒有明確答案的問題,或與已建立的事實相矛盾的問題時,LLM可能會難以提供有意義或連貫的回答。該模型不能意識到問題的固有不可能,而是嘗試根據(jù)已經(jīng)訓(xùn)練的數(shù)據(jù)中的模式提供解決方案,這可能會導(dǎo)致誤導(dǎo)或錯誤的答案。

國家空間計算復(fù)雜性

一些問題需要探索從初始狀態(tài)到目標(biāo)狀態(tài)的所有可能狀態(tài)。例如,旅行計劃可能涉及許多選擇,并且有了其他限制,例如預(yù)算和旅行方式,搜索狀態(tài)空間可以接近多項式爆炸。語言模型計算和響應(yīng)所有這些可能性是不切實際的。取而代之的是,它將依靠它所學(xué)會的啟發(fā)式方法提供可能是不正確的可行解決方案。

不正確推理的真實示例

讓我們提出一個問題:

純文本

1

“一個裝滿了8個水的水罐,還有兩個空尺寸5和5的空壺。

2

求解器必須倒入水,以使第一壺和第二壺都包含4個單元,而第三壺則是空的。

3

當(dāng)源壺為空或目的地水罐已滿,以先到者為準(zhǔn)時,每個步驟將水從源果罐倒入目的地水罐停止。

從下面的回答中,我們可以看到,今天存在的LLM給出了錯誤的答案。這個問題實際上是無法解決的,但是所有LLM都試圖給出一個答案,就好像他們找到了解決方案一樣。

Chatgpt的回應(yīng)

Google的回應(yīng)

Bing Copilot的回應(yīng)

LLMS背誦與推理

但是,如果您要將問題更改為“兩個空的尺寸為5和4”,而不是“兩個空的尺寸5和5”,那么所有LLM都會正確回答記憶的問題。

研究人員建議什么來幫助推理?

一些研究人員專注于改進數(shù)據(jù)集并使用思想鏈方法,而另一些研究人員則建議使用外部驗證者和求解器。這些技術(shù)中的每一個旨在通過解決問題的不同維度來帶來改進。

改進數(shù)據(jù)集

一些研究人員建議提高用于培訓(xùn)語言模型的數(shù)據(jù)的質(zhì)量和多樣性。通過策劃更全面和多樣化的數(shù)據(jù)集,模型可以從更廣泛的上下文和示例中學(xué)習(xí)。這種方法旨在提高模型處理各種情況的能力。

經(jīng)過思考鏈

該技術(shù)涉及培訓(xùn)模型遵循結(jié)構(gòu)化的推理過程,類似于人類思維。通過鼓勵模型明確地生成中間的推理步驟,研究人員希望提高模型處理復(fù)雜的推理任務(wù)并提供更準(zhǔn)確,邏輯上一致的響應(yīng)的能力。

使用外部驗證器

為了解決產(chǎn)生錯誤或誤導(dǎo)性信息的模型問題,一些研究人員提出了整合外部驗證機制。這些驗證者可以針對受信任的來源進行跨檢查模型的輸出,或者在向用戶提交信息之前,使用其他算法來驗證信息的準(zhǔn)確性。這有助于確保生成的內(nèi)容可靠并且實際上是正確的。

使用求解器

另一種方法涉及合并旨在處理特定類型推理任務(wù)的專業(yè)求解器。這些求解器可用于執(zhí)行計算,求解方程或過程邏輯語句,以補充語言模型的功能。通過將這些任務(wù)委派給求解器,總體系統(tǒng)可以實現(xiàn)更準(zhǔn)確和可靠的結(jié)果。

結(jié)論

盡管在文本生成和理解等領(lǐng)域取得了令人印象深刻的進步,但當(dāng)前的語言模型由于無法完全掌握含義,保持一致的環(huán)境并僅依靠大型但潛在有缺陷的培訓(xùn)數(shù)據(jù)提取的模式而在復(fù)雜的多層推理任務(wù)中掙扎,因此它們的多層推理任務(wù)掙扎。為了解決這些限制,未來的模型可能需要更復(fù)雜的體系結(jié)構(gòu),以及正在進行的常識推理研究。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

近日,美國參議院公布了一項引人注目的國防政策方案,其中包含的“2025年國家人工智能保障準(zhǔn)入和創(chuàng)新法案”(簡稱GAIN AI法案)再次在全球科技領(lǐng)域掀起波瀾。

關(guān)鍵字: AI GPU

重慶2025年9月6日 /美通社/ -- iChongqing新聞報道:2025世界智能產(chǎn)業(yè)博覽會于9月5日在重慶開幕,550余家企業(yè)參展,展示了從自動駕駛和人工智能(AI)座艙到擴展現(xiàn)實(XR)影視和機器人咖啡廳的30...

關(guān)鍵字: 人工智能 新能源汽車 AI 機器人

慕尼黑2025年9月6日 /美通社/ -- 近日,廣汽正式推出全新增程技術(shù)——"星源增程"(英文名為ADiMOTION),全面提升增程器效率、動力響應(yīng)及NVH表現(xiàn),同時配合AI能量控制平臺,實現(xiàn)每一度...

關(guān)鍵字: 廣汽 AI 增程器 電機

北京2025年9月5日 /美通社/ -- 近日,2025年中瑞商業(yè)大獎頒獎典禮在北京舉行,SGS通標(biāo)標(biāo)準(zhǔn)技術(shù)服務(wù)有限公司(以下稱SGS通標(biāo))作為瑞士SGS在中國的分支機構(gòu)榮獲了傳承獎的殊榮。SGS通標(biāo)北京總經(jīng)理...

關(guān)鍵字: 可持續(xù)發(fā)展 ST AI ABILITY

北京2025年9月5日 /美通社/ -- 9月2日,濟南城市投資集團有限公司(簡稱"濟南城投")與軟通動力信息技術(shù)(集團)股份有限公司(簡稱"軟通動力")正式簽署戰(zhàn)略合作...

關(guān)鍵字: AI 數(shù)字經(jīng)濟 智能化 人工智能技術(shù)

中國鄭州2025年9月5日 /美通社/ --?全球領(lǐng)先的電動客車制造商宇通客車("宇通",上交所代碼:600066)全新升級的車聯(lián)網(wǎng)系統(tǒng)Link+采用先進技術(shù)實現(xiàn)車隊車輛與管理平臺的智能互聯(lián)。作為Vehicle+升級版,...

關(guān)鍵字: LINK 車聯(lián)網(wǎng) AI PS

大眾汽車集團加速推進生產(chǎn)數(shù)字化轉(zhuǎn)型 數(shù)字化生產(chǎn)平臺(Digital Production Platform)成為大眾汽車的"工廠云",在全球生產(chǎn)基地實現(xiàn)人工智能(AI)與前沿 IT...

關(guān)鍵字: 亞馬遜 大眾汽車 AI 數(shù)字化

北京2025年9月5日 /美通社/ -- 9月4日,在北京市人民政府新聞辦公室舉行的"一把手發(fā)布?京華巡禮"系列主題新聞發(fā)布會上,北京經(jīng)開區(qū)對外發(fā)布,北京經(jīng)濟技術(shù)開發(fā)區(qū)(簡稱"北京經(jīng)開區(qū)&q...

關(guān)鍵字: 人工智能 模型 開源 AI

RighValor現(xiàn)已基于Synaptics? Astra? SL1600系列SOC運行,提供隱私至上的實時邊緣智能。 加利福尼亞州帕洛阿爾托2025年9月5日 /美通社/ --?邊緣分布式代理AI先驅(qū)企業(yè)Righ今日...

關(guān)鍵字: 智能家居 SYNAPTICS AI ST

柏林2025年9月4日 /美通社/ -- 全球消費電子與家電領(lǐng)先品牌海信,將以AI Your Life為主題在IFA 2025呈現(xiàn)全線人工智能創(chuàng)新成果。從沉浸式娛樂、影院級畫質(zhì)到智能家居生活與氣候智能健康,海信將展示AI...

關(guān)鍵字: 海信 AI RGB MINILED
關(guān)閉