Kimi視覺思考模型k1發(fā)布:數(shù)理化超越OpenAI o1、GPT-4o
12月16日消息,今日,月之暗面國產(chǎn)大模型Kimi發(fā)布視覺思考模型k1,k1基于強化學習技術打造,原生支持端到端圖像理解和思維鏈技術,并將能力擴展到數(shù)學之外的更多基礎科學領域。
k1已陸續(xù)上線最新版Kimi智能助手的Android和iPhone APP以及網(wǎng)頁版kimi.com。
在最新版手機APP或網(wǎng)頁版Kimi+頁面找到Kimi視覺思考版,即可拍照或傳圖體驗。
據(jù)了解,在數(shù)學、物理、化學等基礎科學學科的基準能力測試中,初代k1模型的表現(xiàn)超過了全球標桿模型OpenAI o1、GPT-4o以及Claude 3.5 Sonnet。
官方表示,K1模型真正意義上實現(xiàn)了端到端的圖像理解和思考能力,模型可以直接處理用戶輸入的圖像信息并進行思考得出答案,不需要借助外部的OCR或額外視覺模型進行信息處理。
從模型訓練的角度看,k1的訓練分為兩個階段,先通過預訓練得到基礎模型,再在基礎模型上進行強化學習后訓練。