www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 芯聞號 > 極客網(wǎng)
[導(dǎo)讀]自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構(gòu)信息當(dāng)作真實(shí)事實(shí)輸出。

自誕生以來,人工智能大模型始終被“幻覺”問題困擾。這里的“幻覺”,指的是大語言模型會將虛構(gòu)信息當(dāng)作真實(shí)事實(shí)輸出。實(shí)際上,“幻覺”這一表述相當(dāng)委婉,它實(shí)則暴露出AI的核心缺陷——當(dāng)前的大語言模型尚未達(dá)到真正意義上的智能水平。

就在上個(gè)月,編程工具Cursor引發(fā)一場風(fēng)波。用戶收到消息稱,其使用政策將進(jìn)行調(diào)整,未來僅支持在單臺電腦上使用。然而,這條消息很快被證實(shí)為假。Cursor首席執(zhí)行官兼聯(lián)合創(chuàng)始人Michael Truell迅速出面澄清:“我們并未制定類似政策,用戶完全可以在多臺設(shè)備上使用Cursor。這一錯(cuò)誤信息源于一線AI機(jī)器人的錯(cuò)誤回復(fù)。”

此次事件不僅讓用戶虛驚一場,更直觀展現(xiàn)了人工智能系統(tǒng)的不穩(wěn)定。

幻覺成為AI進(jìn)化的攔路虎

經(jīng)過數(shù)年發(fā)展,盡管AI技術(shù)在諸多領(lǐng)域取得突破,但在判斷信息真假時(shí)仍不盡如人意。即使是OpenAI、谷歌、DeepSeek等行業(yè)頭部機(jī)構(gòu)研發(fā)的模型也存在許多錯(cuò)誤輸出。

值得警惕的是,這些錯(cuò)誤并未隨著時(shí)間推移而減少,反而呈現(xiàn)增多趨勢。誠然,AI在數(shù)學(xué)運(yùn)算、編程領(lǐng)域有所提升,但在處理復(fù)雜事實(shí)性信息時(shí)依然存在明顯短板,難以滿足用戶需求。

今天的AI實(shí)際上是根據(jù)“復(fù)雜數(shù)學(xué)系統(tǒng)”構(gòu)建的,它們通過不斷分析海量數(shù)字?jǐn)?shù)據(jù),持續(xù)優(yōu)化自身性能。然而,算法系統(tǒng)始終存在一個(gè)根本性缺陷——無法有效區(qū)分信息真假。在一項(xiàng)測試中,相較于舊版AI系統(tǒng),新版AI系統(tǒng)的“幻覺率”竟然更高,這說明AI面臨嚴(yán)峻挑戰(zhàn)。

Vectara專注于企業(yè)級AI工具開發(fā),其首席執(zhí)行官Amr Awadallah直言:“盡管我們傾盡全力,可‘幻覺’問題還是存在,它并沒有消失?!爆F(xiàn)狀表明,即便在專業(yè)團(tuán)隊(duì)的持續(xù)攻堅(jiān)下,AI“幻覺”依然是難以攻克的技術(shù)頑疾。

Okahu致力于解決AI“幻覺”問題,其首席執(zhí)行官Pratik Verma也指出:“判斷AI回應(yīng)是事實(shí)還是虛假需要耗費(fèi)大量時(shí)間。如果不能妥善處理這些錯(cuò)誤,就無法保證人工智能系統(tǒng)發(fā)揮應(yīng)有價(jià)值,畢竟這些系統(tǒng)的設(shè)計(jì)初衷是幫助用戶自動完成各項(xiàng)任務(wù)?!?

AI企業(yè)并非不清楚“幻覺”問題的存在,它們付出了巨大努力,但始終無法有效解決這一難題。OpenAI的內(nèi)部測試顯示,相比老系統(tǒng),它所開發(fā)的新系統(tǒng)“幻覺率”反而更高。

在PersonQA標(biāo)準(zhǔn)測試中,o3模型在33%的回答中產(chǎn)生幻覺,幾乎是o1模型(16%)的兩倍,而最新的o4-mini模型表現(xiàn)更差,“幻覺率”高達(dá)48%。若采用SimpleQA標(biāo)準(zhǔn)測試,情況同樣不容樂觀。o3和o4-mini的“幻覺率”分別達(dá)到51%和79%,o1模型的“幻覺率”也有44%。

OpenAI指出,AI系統(tǒng)從海量數(shù)據(jù)中學(xué)習(xí),數(shù)據(jù)量之巨遠(yuǎn)超人類專家的理解能力,因此很難確定問題根源究竟在哪里。

人類恐怕不能解決AI幻覺

華盛頓大學(xué)及艾倫人工智能研究所研究人員Hannaneh Hajishirzi表示,他們找到一種新方法,能夠追溯AI特定行為在訓(xùn)練數(shù)據(jù)中的源頭。但由于系統(tǒng)學(xué)習(xí)的數(shù)據(jù)量過于龐大,新工具無法解釋所有情況。Hannaneh Hajishirzi坦言:“我們?nèi)匀桓悴磺暹@些模型到底是如何運(yùn)行的。”

Vectara近年來持續(xù)對AI系統(tǒng)展開測試,通過讓系統(tǒng)總結(jié)新聞內(nèi)容的方式,觀察“幻覺率”的變化情況。然而,測試結(jié)果令人沮喪——“幻覺率”不僅未降低,反而呈上升趨勢。

長期以來,OpenAI認(rèn)定一個(gè)理念:向AI投喂的數(shù)據(jù)越多,AI就會越聰明。但如今,AI在訓(xùn)練時(shí)幾乎耗盡所有互聯(lián)網(wǎng)英文信息,它的幻覺卻愈發(fā)嚴(yán)重。這一現(xiàn)實(shí)表明,若想突破“幻覺”困境必須探尋新的技術(shù)路徑。

當(dāng)前,工程師們開始倚重“強(qiáng)化學(xué)習(xí)”技術(shù)。在數(shù)學(xué)、編程等領(lǐng)域,強(qiáng)化學(xué)習(xí)確實(shí)能通過試錯(cuò)機(jī)制實(shí)現(xiàn)學(xué)習(xí)與進(jìn)步,但在部分領(lǐng)域,該技術(shù)仍未帶來明顯改善。

此外,推理模型在解答復(fù)雜問題時(shí)會先進(jìn)行“思考”,采用分步解決的策略。然而,每個(gè)思考步驟都潛藏著產(chǎn)生“幻覺”的風(fēng)險(xiǎn),思考步驟越多,累積的錯(cuò)誤也就越多,這無疑給提升AI信息準(zhǔn)確性帶來更大挑戰(zhàn)。

如今的AI能夠展示思考過程,使用戶可以看到錯(cuò)誤產(chǎn)生的環(huán)節(jié),這無疑是技術(shù)層面的一大進(jìn)步。然而研究人員發(fā)現(xiàn),AI所展示的思考步驟可能與最終答案毫無關(guān)聯(lián)。Anthropic研究人員Aryo Pradipta Gema直言:“AI系統(tǒng)聲稱自己正在思考,但它的思考有時(shí)并無必要。”

一些研究人員甚至認(rèn)為,杜絕AI“幻覺”不可能實(shí)現(xiàn),只能通過多種方法降低“幻覺率”。比如讓AI直面自身知識盲區(qū),主動向用戶承認(rèn)“我不知道”;引入“檢索增強(qiáng)生成”技術(shù),促使AI通過檢索相關(guān)文檔輔助作答,而非單純依賴記憶數(shù)據(jù)直接輸出答案。

美國東北大學(xué)體驗(yàn)式人工智能研究所研究人員Usama Fayyad提出,“幻覺”這一表述存在概念偏差,它過度擬人化。Usama Fayyad強(qiáng)調(diào),AI生成錯(cuò)誤信息與人類產(chǎn)生幻覺存在本質(zhì)差異——AI既無意圖,也無意識,應(yīng)避免用帶有情感色彩的詞匯模糊技術(shù)本質(zhì)。(小刀)

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權(quán)不予轉(zhuǎn)載,侵權(quán)必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉