就像李开复老师的说的,Sam Altman 觉又要睡不好了!
事情是这样的,DeepSeek 悄悄的推出了deepseek v3一个版本更新-v3 0324,没有做任何宣传,没有任何benchmark,直接上传hugging face,大约700G,还是MIT许可,可以直接部署,或者现在就可以在deepseek官网直接使用(不要开启思考模式就行)
本来以为这就是一个普通的更新,我没当回事,结果测试了一下,没想到这个版本的能力强到离谱,我的直观体验是编程能力,尤其是前端表现和Claude 3.7 Sonnet表现不相上下,考虑到deepseek的API的价格,真的非常令人震惊!!!
以下是实测,全部都是一次运行,未做任何修改
实测1
这是一个我测试各家大模型最新版本最常用的一个题目
提示: 帮我制作一个赛朋克贪吃蛇游戏,在单个HTML中运行
这是测试过程
这是测试结果,没有任何逻辑错误,也比较好的实现了赛朋克效果,实现效果比R1和Claude 3.7都要好(R1和Claude 的表现我之前的文章有,贪吃蛇游戏虽然很简单,但是加上赛朋克三个字很多新模型实现起来逻辑总是有bug,这里就不作对比了)
实测2
这是网友的一个提示词,我看看是否能复刻
提示: Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions (e.g., a function or a set of buttons) to demonstrate the animations for each.
中文:创建一个包含 CSS 和 JavaScript 的 HTML 文件,生成一张动画天气卡片。该卡应以独特的动画直观地表现以下天气状况: 风:(如移动的云、摇摆的树或风线) 雨:(如落下的雨滴、形成的水坑) 太阳:(如闪耀的光芒、明亮的背景) 雪:(如飘落的雪花、积雪) 并排显示所有天气卡片。在此单一文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包括在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气条件的动画效果
测试过程:
测试结果:完美,完全达到了要求,设计非常精美,细节满满,比如积雪厚度动态效果,高亮每一种天气卡片的按钮,唯一的遗憾是没能够并排显示所有天气卡片,但是整体的指令遵循能力非常强与Claude 3.7相比有过之而无不及
这是Claude 3.7 Sonnet的测试过程和结果,大家对比一下,Claude 3.7实现缺少了一些细节,也没有天气卡片的切换按钮
我顺便也用同样的提示词测试了一下R1的表现,很明显没有v3的新版本好
实测3
这个测试主要是测试模型在极简提示下实现复杂系统的能力
提示:模拟一个太阳系行星运动,在单个HTML中运行
这是测试过程:
测试结果也是让我很震惊:比较完美的模拟的太阳系的行星运动,我的提示词里甚至没有对宇宙环境,轨道,行星数量等的细节描述,结果他设置了模拟行星运动三种模式:慢速,标准,加速,土星还有土星环,这都是让我没有想到的
同样的提示词,这是R1的测试过程和结果,相对于V3新版本缺少了很多细节
写在最后
时间有限,我只是简单的测试了一下,没有系统性,有网友测试v3 0324的数学能力也很强,大家现在到DeepSeek官网直接就可以测试,纯粹个人感受:小更新大进步!这下更加期待DeepSeek V4和R2了
⭐星标AI寒武纪,好内容不错过⭐
用你的赞和在看告诉我~