每日經(jīng)濟新聞 2025-11-27 22:41:34
每經(jīng)編輯|程鵬
11月27日,DeepSeek在HuggingFace推出新型數(shù)學(xué)推理模型DeepSeekMath-V2,采用可自我驗證的訓(xùn)練框架。該模型基于DeepSeek-V3.2-Exp-Base構(gòu)建,通過LLM驗證器自動審查生成的數(shù)學(xué)證明,并利用高難度樣本持續(xù)優(yōu)化性能。在IMO 2025和CMO 2024中均達到金牌水平,Putnam 2024獲118/120分。團隊表示,該成果驗證了自驗證推理路徑的可行性,為構(gòu)建可靠數(shù)學(xué)智能系統(tǒng)提供新方向。模型代碼與權(quán)重已開源,發(fā)布于Hugging Face及GitHub平臺。

編輯|程鵬 杜恒峰
校對|金冥羽
封面圖片來源:視覺中國

來源:每經(jīng)快訊
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP