DeepSeek-V3.1是2025年8月19日DeepSeek于在Hugging Face 上开源的新模型,并于8月21日正式发布。 DeepSeek称其为“迈向Agent(智能体)时代的第一步”。
DeepSeek-V3.1 的核心创新在于混合推理能力,用户可以通过“深度思考”按钮在思考模式和非思考模式之间自由切换。从官方APP和网页端的显示来看,DeepSeek去掉了“深度思考(R1)”中的“R1”标识。DeepSeekV3.1最引人注目的升级之一是将上下文窗口从原有的64k扩展至128k,意味着其可以处理更长篇幅的文档和代码,并在回答内容上进一步增加信息,提供更多细节。
主要升级包括:
混合推理架构:一个模型同时支持思考模式与非思考模式;
更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;
更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。
官方App与网页端模型已同步升级为 DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。
DeepSeek API 也已同步升级,“deepseek-chat”对应非思考模式,“deepseek-reasoner”对应思考模式,且上下文均已扩展为 128K。另外,还增加了对Anthropic API 格式的支持,以供大家将V3.1能力接入Claude Code框架。
更引起注意的是,作为掀起大模型API价格战的肇始者,DeepSeek开始涨价了。
发力智能体
在本次公告中,DeepSeek直接将V3.1定位为“迈向 Agent 时代的第一步”。显然,DeepSeek已将模型发力点瞄向AI Agent,追求在编程智能体、搜索智能体等多任务中达到更优表现。
根据官方测试,在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明显提高。
供稿人:周彬 2025年8月