一个好音问91 丝袜,时隔俩月, DeepSeek 终于更新了。
就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模子。
模子参数 6850 亿,跟上一个版块的 V3 ( 6710 亿 )收支不大,摄取 MoE 架构,还守旧了更洞开的 MIT 开源条约。
证实官方更新的版块讲明, DeepSeek -V3-0324 主如果针对推明智力和前端诞生智力进行了加强,写稿作风完了了跟 R1 对都,另外还有一些其他方面的小优化。
当今掀开 DeepSeek 官网,把深度想考花式关掉就能平直用上 V3-0324 。
不外有一说一,诚然 V3-0324 只是只是 V3 的小版块升级,并不是大伙儿期待已久的 V4 大要 R2 ,且官方账号也莫得发布任何跟模子关连的信息。
但也涓滴不妨碍, V3-0324 一上线,就有东说念主说他的代码智力,直追克劳德。
秦岚 ai换脸新版块的模子刚一上传,就登上了 Hugging Face 的趋势榜单。
在国际大模子竞技场 KCORES 的测评中, V3-0324 的代码智力得分 328.3 ,越过了粗俗版的 Claude 3.7 Sonnet 的 322.3 分,接近 Claude 3.7 Sonnet 想维链版块的 334.8 分,名挨次三。
图源 @karminski 牙医
要点是91 丝袜,名次在前边的模子根底就没几个开源免费的, V3-0324 可谓是轶群出众。