DeepSeek V3小版本大升级:推理、前端开发加强 这些能力超越GPT-4.5
快科技3月25日消息,今晚,DeepSeek官宣,DeepSeek V3模型已完成小版本升级。
目前版本号为DeepSeek-V3-0324,用户登录官方网页、App、小程序进入对话界面后,关闭深度思考即可体验,API 接口和使用方式保持不变。
虽然是小版本更新,但从反馈来看,这次升级带来的性能提升却相当显著,特别是在前端开发、数学推理和上下文理解方面有了明显进步。
据了解,新版V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。

同时,在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。
在中文写作任务方面,新版V3模型基于R1的写作水平进行进一步优化,同时特别提升了中长篇文本创作的内容质量。
此外,新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。
其他方面,该模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。
据DeepSeek介绍,DeepSeek-V3-0324与之前的DeepSeek-V3使用同样的base模型,仅改进了后训练方法。
私有化部署时只需更新checkpoint和tokenizer_config.json(tool calls 相关变动)。
模型参数约660B,开源版本上下文长度为128K(网页端、App和API提供64K上下文)。
与DeepSeek-R1保持一致,此次DeepSeek开源仓库(包括模型权重)统一采用MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。


【本文结束】如需转载请务必注明出处:快科技
责任编辑:拾柒
文章内容举报
-
浅 浅语科技
杭州飞香港航班行李架起火:空乘用百事可乐成功灭火
-
大 大任时讯
康茅酒业成功登陆纳斯达克,开创中国酱香白酒国际化新纪元
-
浅 浅语科技
教育部上线国家智慧教育平台:科大讯飞AI求职助手入选
-
浅 浅语科技
拼多多2024年营收近4000亿 增长59% 净利润大涨80%
-
浅 浅语科技
比亚迪“老板娘”李柯透露:王传福一周工作七天 每周工作112小时
-
鲁 鲁网
青岛市崂山区:力争今年智能家电产业营收规模突破290亿
-
浅 浅语科技
52岁网红面筋哥因病离世:因歌曲《烤面筋》走红 2018年B站百大UP主
-
浅 浅语科技
OPPO磁吸宇宙来了!Find X8全新系列磁吸配件公布
-
浅 浅语科技
理想汽车高管:5年前说“增程是未来的主力”很多人不屑一顾
-
浅 浅语科技
小米进军日本!首个小米之家正式开业:人气爆满
-
浅 浅语科技
上海交大研发“水平对置两缸增程专用发动机”:成本直降三分之二
-
浅 浅语科技
全身都是狠货的仰望U7:看完我真觉得有些可惜
-
浅 浅语科技
董明珠开会当场怼员工:少废话
-
搜 搜狐科技
张亚勤:无人驾驶将在今年迎来“Chat GPT时刻”,10%的新车在2030年有L4能力
-
浅 浅语科技
缅甸7.9级地震 云南瑞丽强震感:网友25楼高层墙体开裂!一地狼藉
-
浅 浅语科技
小米SU7 Ultra市区时速150km撞飞电动车:伤者还在ICU 事故责任还未认定
-
勇 勇乐大帝
蓝牙耳机品牌哪个好,2025年公认高性价比推荐,用户一致好评!
-
浅 浅语科技
阔折叠华为Pura X下周开售 官方服务上线:享免费屏幕保养、上门服务等
-
浅 浅语科技
蔚来李斌:去年我们花3亿美元买了80万颗英伟达芯片
-
多 多彩贵州网
【2025 中关村论坛年会】前沿观点碰撞!大咖 “金句” 解锁科技发展新密码
-
浅 浅语科技
理想汽车总裁:建议让增程车在城市内和纯电车平权
-
浅 浅语科技
于东来教员工80%的钱要花自己身上:你要为自己而活
-
浅 浅语科技
大批九号电动车车标被偷!官方公告:将免费补装