DeepSeek的一次小更新 堪比发布新模型
一个好消息,时隔俩月, DeepSeek 终于更新了。
就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模型。
模型参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不大,采用 MoE 架构,还支持了更开放的 MIT 开源协议。
根据官方更新的版本说明, DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强,写作风格实现了跟 R1 对齐,另外还有一些其他方面的小优化。

现在打开 DeepSeek 官网,把深度思考模式关掉就能直接用上 V3-0324 。
不过有一说一,虽然 V3-0324 仅仅只是 V3 的小版本升级,并不是大伙儿期待已久的 V4 或者 R2 ,且官方账号也没有发布任何跟模型有关的信息。
但也丝毫不妨碍, V3-0324 一上线,就有人说他的代码能力,直追克劳德。

新版本的模型刚一上传,就登上了 Hugging Face 的趋势榜单。
在国外大模型竞技场 KCORES 的测评中, V3-0324 的代码能力得分 328.3 ,超过了普通版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 思维链版本的 334.8 分,排名第三。
图源 @karminski 牙医

重点是,排名在前面的模型压根就没几个开源免费的, V3-0324 可谓是一枝独秀。
-
浅 浅语科技
小米SU7 Ultra前备箱能装下女生 官方:建议不超20KG
-
浅 浅语科技
冷空气终于要走了:气温将迅速回升
-
浅 浅语科技
微短剧爆火!网友:横店变“竖店”了
-
浅 浅语科技
中国C909飞机走向全球!首次交付老挝航空
-
浅 浅语科技
AI预测彩票中奖号码都是骗局!专家:几乎不可能中大奖
-
浅 浅语科技
华为、比亚迪“引领”兆瓦级充电:2025年或成闪充“元年”
-
浅 浅语科技
历史参评车型最高等级!问界M9中保研最新碰撞测试成绩出炉
-
人 人民网,供稿:人民资讯
深圳罗湖:为全球AI人才定制“安居乐业”大礼包
-
每 每日养生
DESON德尚2025 HOTELEX上海展:以模块化创新延展无限空间
-
浅 浅语科技
佛山一公司要求员工每月加班10晚以上:一纸通知引发热议
-
浅 浅语科技
10万枚鸡蛋差点全烤熟!散落高速一片狼藉
-
浅 浅语科技
《封神2》最后一天上映 导演乌尔善发文:批评和建议都会记在心里
-
浅 浅语科技
NVIDIA强制!所有RTX 50笔记本必须明确标注显卡功耗
-
浅 浅语科技
史上最强鸿蒙手机!华为Pura 80系列前瞻:全新1英寸主摄加持
-
福 福州新闻网
标准引领绿色消费新风尚焕新中国行 智享新生活 | 海尔换新万里行漳州启幕,三好标准引领绿色消费新风尚
-
浅 浅语科技
首款无激素男性避孕药或将问世:正进行二次人体临床试验
-
浅 浅语科技
一觉醒来 我国又一卫星成功发射
-
民 民生播报
论文写作不再难!免费一键生成+选题定稿全攻略
-
浅 浅语科技
AMD公版RX 9070 XT首次无死角曝光、拆解:看着好眼熟
-
浅 浅语科技
台积电2nm马上量产:工厂火力全开 苹果首发
-
浅 浅语科技
国家标准住宅项目规范正式发布:层高不低于3米、电梯内应有信号
-
浅 浅语科技
比亚迪李云飞:车企营销应以量产为准 很多车企宣传一年也没影
-
浅 浅语科技
小米SU7 Ultra车主线下聚会:有网友开豪车来参加活动