OpenAI開(kāi)源兩款gpt-oss系列推理大模型能力接近o3和o4-mini

時(shí)間：2025-08-06 13:23:05

關(guān)鍵字：硅谷 996 007 AI OpenAI 人工智能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]8月6日消息，OpenAI近期發(fā)布了開(kāi)源模型系列g(shù)pt-oss，此次發(fā)布包括兩款開(kāi)源模型——gpt-oss-120b和gpt-oss-20b，是針對(duì)不同應(yīng)用需求特化的高效AI模型。

8月6日消息，OpenAI近期發(fā)布了開(kāi)源模型系列g(shù)pt-oss，此次發(fā)布包括兩款開(kāi)源模型——gpt-oss-120b和gpt-oss-20b，是針對(duì)不同應(yīng)用需求特化的高效AI模型。

gpt-oss系列特點(diǎn)

gpt-oss-120b：適用于大規(guī)模、高性能推理任務(wù)，包含1170億個(gè)參數(shù)，且有5.1億個(gè)活躍參數(shù)，專為單個(gè)H100 GPU優(yōu)化。

gpt-oss-20b：專為低延遲和本地化應(yīng)用設(shè)計(jì)，包含210億個(gè)參數(shù)，活躍參數(shù)為3.6億，適合在資源有限的環(huán)境下運(yùn)行。

這兩個(gè)模型都能為開(kāi)發(fā)者提供完整的推理鏈條，并允許開(kāi)發(fā)者對(duì)模型的推理過(guò)程進(jìn)行監(jiān)控和調(diào)試，提升了輸出結(jié)果的可靠性和可解釋性。更重要的是，gpt-oss系列支持強(qiáng)大的代理功能，能夠執(zhí)行功能調(diào)用、網(wǎng)頁(yè)瀏覽和Python代碼等操作，使其在復(fù)雜應(yīng)用中表現(xiàn)出色。

推理能力與優(yōu)化

gpt-oss系列不僅在標(biāo)準(zhǔn)任務(wù)中表現(xiàn)出色，其推理能力的優(yōu)化也讓它在多個(gè)實(shí)際應(yīng)用中成為首選。兩個(gè)模型的參數(shù)調(diào)整可以根據(jù)具體需求靈活設(shè)置，支持低、中、高三種推理力度，滿足不同延遲需求的應(yīng)用場(chǎng)景。開(kāi)發(fā)者還可以根據(jù)具體需求，進(jìn)行模型微調(diào)，以進(jìn)一步優(yōu)化其在特定任務(wù)中的表現(xiàn)。

模型對(duì)比：

在多個(gè)標(biāo)準(zhǔn)化測(cè)試中，gpt-oss系列的表現(xiàn)相當(dāng)突出，尤其是在MMLU、GPQA、以及競(jìng)賽數(shù)學(xué)等領(lǐng)域。以下是gpt-oss-120b和gpt-oss-20b與gpt-o3和o4-mini的對(duì)比數(shù)據(jù)：

OpenAI的gpt-oss系列模型憑借其強(qiáng)大的推理能力和廣泛的應(yīng)用場(chǎng)景，成為了開(kāi)發(fā)者手中的有力工具。其開(kāi)源特性、強(qiáng)大的定制能力和優(yōu)化的推理性能，使其在AI開(kāi)發(fā)和應(yīng)用中具有巨大的潛力。隨著AI技術(shù)的不斷發(fā)展，gpt-oss系列無(wú)疑為更多的開(kāi)發(fā)者提供了探索、創(chuàng)新和實(shí)現(xiàn)突破的可能。