DeepSeek的一次小更新 堪比发布新模型
一个好消息,时隔俩月, DeepSeek 终于更新了。
就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。
模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。
根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。

现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。
不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。
但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。
新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。
在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。
图源 @karminski 牙医
重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。
特别声明:以上内容为自媒体平台“明珠号”用户上传并发布,本平台仅提供信息存储服务。如有侵权,请联系我们toutiao@em.eastday.com
今日热点
小编精选
-
来源:人民网,供稿:人民资讯
-
《让孩子学会提问》出版:在人工智能时代重塑教育的底层能力
来源:鲁网
-
京东加磅力推宠物业务:亿元补贴 分析百万商品基因图谱 让千万爆品翻倍
来源:消费日报网
-
从票据服务出发,看深度数科如何搭建数贸生态新 “桥梁”
来源:鲁网
-
深度数科“承信账户”破解企业间结算和融资双难题
来源:鲁网
-
信光能源以智能工厂赋能全球能源转型 打造智慧能源新标杆
来源:北青网
-
灵动生活 | 《遇见·团体心理公开课》厦门站圆满落幕
来源:北青网
-
新东方大愚文化图书为何持续霸榜?这场直播给出答案
来源:北青网
-
山东移动滨州分公司开展“总经理驻厅接待日”活动:民有所呼 我必有应 倾听客户心声,共筑服务新体验
来源:鲁网
-
苏州打造文商旅深度融合商业地标 引领高端消费新风尚
来源:消费日报网
-
全棉时代上线产品检测报告自助查询,近50款在售卫生巾质检100%合格
来源:消费日报网
-
京东·上海国际路亚展30日开幕 京东采销携EWE、禧玛诺带来最新款渔具
来源:消费日报网
-
价值千万珍珠项链“首秀”亮相博鳌!下一站:第五届消博会
来源:南海网
-
深度数科:从供票高地山东崛起的票据服务标杆,引领票据服务创新浪潮
来源:鲁网
-
焕新力聚 颜起未来 | 善颜2025服务商赋能大会圆满举行
来源:鲁网
-
“破壳计划”青年创业微课堂第三期开班
来源:大众网
-
蓝月亮2024年营收增16% 深耕至尊洗衣液 全方位守护消费者
来源:中国网
-
第二十七届高速公路信息化大会|百度智能云:百度交通大模型增强版感知能力达95%以上
来源:大众网
-
美图秀秀联手新疆文化发展研究中心创新推出“国潮纹样新疆篇” 传递丝路美学
来源:北青网
-
龙湖集团与蚂蚁集团达成战略合作,共创“碰一下”服务新体验
来源:北青网
-
重构未来家居生活新范式 火星人未来家品牌战略升级发布会开启智能生活新想象
来源:北青网