OpenAI開(kāi)源兩款gpt-oss系列推理大模型 能力接近o3和o4-mini
8月6日消息,OpenAI近期發(fā)布了開(kāi)源模型系列g(shù)pt-oss,此次發(fā)布包括兩款開(kāi)源模型——gpt-oss-120b和gpt-oss-20b,是針對(duì)不同應(yīng)用需求特化的高效AI模型。
gpt-oss系列特點(diǎn)
gpt-oss-120b:適用于大規(guī)模、高性能推理任務(wù),包含1170億個(gè)參數(shù),且有5.1億個(gè)活躍參數(shù),專為單個(gè)H100 GPU優(yōu)化。
gpt-oss-20b:專為低延遲和本地化應(yīng)用設(shè)計(jì),包含210億個(gè)參數(shù),活躍參數(shù)為3.6億,適合在資源有限的環(huán)境下運(yùn)行。
這兩個(gè)模型都能為開(kāi)發(fā)者提供完整的推理鏈條,并允許開(kāi)發(fā)者對(duì)模型的推理過(guò)程進(jìn)行監(jiān)控和調(diào)試,提升了輸出結(jié)果的可靠性和可解釋性。更重要的是,gpt-oss系列支持強(qiáng)大的代理功能,能夠執(zhí)行功能調(diào)用、網(wǎng)頁(yè)瀏覽和Python代碼等操作,使其在復(fù)雜應(yīng)用中表現(xiàn)出色。
推理能力與優(yōu)化
gpt-oss系列不僅在標(biāo)準(zhǔn)任務(wù)中表現(xiàn)出色,其推理能力的優(yōu)化也讓它在多個(gè)實(shí)際應(yīng)用中成為首選。兩個(gè)模型的參數(shù)調(diào)整可以根據(jù)具體需求靈活設(shè)置,支持低、中、高三種推理力度,滿足不同延遲需求的應(yīng)用場(chǎng)景。開(kāi)發(fā)者還可以根據(jù)具體需求,進(jìn)行模型微調(diào),以進(jìn)一步優(yōu)化其在特定任務(wù)中的表現(xiàn)。
模型對(duì)比:
在多個(gè)標(biāo)準(zhǔn)化測(cè)試中,gpt-oss系列的表現(xiàn)相當(dāng)突出,尤其是在MMLU、GPQA、以及競(jìng)賽數(shù)學(xué)等領(lǐng)域。以下是gpt-oss-120b和gpt-oss-20b與gpt-o3和o4-mini的對(duì)比數(shù)據(jù):
OpenAI的gpt-oss系列模型憑借其強(qiáng)大的推理能力和廣泛的應(yīng)用場(chǎng)景,成為了開(kāi)發(fā)者手中的有力工具。其開(kāi)源特性、強(qiáng)大的定制能力和優(yōu)化的推理性能,使其在AI開(kāi)發(fā)和應(yīng)用中具有巨大的潛力。隨著AI技術(shù)的不斷發(fā)展,gpt-oss系列無(wú)疑為更多的開(kāi)發(fā)者提供了探索、創(chuàng)新和實(shí)現(xiàn)突破的可能。