DeepSeek发布两款新模型-紫荆网

DeepSeek发布两款新模型

日期:2025-12-02 来源:香港中通社 浏览量: 字号:
分享到
用微信扫描二维码

12月1日,中国科企深度求索(DeepSeek)发布两款新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。官方网页端、App和API(应用程序编程接口)均已更新为正式版V3.2;Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。

深度求索介绍,V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent(智能体)任务场景。在公开的推理类 Benchmark 测试中,V3.2达到了美国科企OpenAI旗下ChatGPT-5的水平。

Speciale是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力。更令人瞩目的是,Speciale模型成功斩获IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛全球总决赛)及IOI 2025(国际信息学奥林匹克)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。

深度求索还表示,在高度复杂任务上,Speciale模型大幅优于标准版本,但消耗的Tokens(token是大模型文本处理的最小单位)也显著更多,成本更高。目前,该模型仅供研究使用,不支持工具调用,暂未针对日常对话与写作任务进行专项优化。

深度求索对这两款新模型进行了开源。

来源:香港中通社

扫描二维码分享到手机

编辑:安涛 校对:刘雨晨 监制:连振海
我国科研人员发现99个新物种
联合国发布报告:中东冲突升级可能引发严重经济后果
美国纽约市宣布撤销政府设备使用TikTok禁令
的士司机提供电子缴费新规定首日 谢咏谊到荃湾视察
紫荆杂志
影响有影响力的人