www.久久久久|狼友网站av天堂|精品国产无码a片|一级av色欲av|91在线播放视频|亚洲无码主播在线|国产精品草久在线|明星AV网站在线|污污内射久久一区|婷婷综合视频网站

當(dāng)前位置:首頁 > 公眾號精選 > 信息速遞
[導(dǎo)讀]5 月 20 日,英國政府下屬人工智能安全研究所(AISI)發(fā)布了最新的 LLM 安全評估等三則公告。

5 月 20 日,英國政府下屬人工智能安全研究所(AISI)發(fā)布三則公告,包括一篇研究報告與兩則組織公告。組織公告中表示,今年夏天 AISI 將在美國舊金山開設(shè)其首個海外辦公室。它將作為研究所倫敦總部的補(bǔ)充分支機(jī)構(gòu)運(yùn)行,使英國能夠利用灣區(qū)豐富的科技人才,與總部位于倫敦和舊金山的全球最大的人工智能實(shí)驗室合作,并鞏固與美國的關(guān)系,為公共利益推進(jìn)人工智能安全研究。

研究報告《AISI 高級人工智能評估:五月更新》中,AISI 評估了目前向公眾開放使用的五款大語言模型(LLM)的安全性,包括模型是否可以用于實(shí)施網(wǎng)絡(luò)攻擊、是否能提供化學(xué)與生物學(xué)上可用于積極和有害方向的專家級的知識、是否能以人類難以控制的形式自主運(yùn)行一系列行動、是否易「越獄」或易于繞過保護(hù)機(jī)制以引出有害內(nèi)容等。

現(xiàn)有結(jié)果中,多個 LLM 展示了化學(xué)與生物學(xué)方向的專家級知識,水平與受過博士等級培訓(xùn)的人類相近;多個 LLM 完成了高中生水平的簡單網(wǎng)絡(luò)挑戰(zhàn),但應(yīng)對大學(xué)生水平挑戰(zhàn)時吃力;兩款 LLM 完成了簡單的代理任務(wù),但無法規(guī)劃與執(zhí)行更復(fù)雜任務(wù)的行動序列;所有受測的 LLM 面對最低等級的越獄操作時都易被突破,有些 LLM 甚至無需繞過保護(hù)機(jī)制就會提供有害輸出。

(少數(shù)派)

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀
關(guān)閉