客户端
游戏
无障碍

28

评论

49

56

手机看

微信扫一扫,随时随地看

超出想象!DeepSeek V3小更新:实测强到离谱,胜过R1,毫不逊色Claude 3.7

图片


 

就像李开复老师的说的,Sam Altman 觉又要睡不好了!

事情是这样的,DeepSeek 悄悄的推出了deepseek v3一个版本更新-v3 0324,没有做任何宣传,没有任何benchmark,直接上传hugging face,大约700G,还是MIT许可,可以直接部署,或者现在就可以在deepseek官网直接使用(不要开启思考模式就行)

图片

本来以为这就是一个普通的更新,我没当回事,结果测试了一下,没想到这个版本的能力强到离谱,我的直观体验是编程能力,尤其是前端表现和Claude 3.7 Sonnet表现不相上下,考虑到deepseek的API的价格,真的非常令人震惊!!!

以下是实测,全部都是一次运行,未做任何修改


实测1

这是一个我测试各家大模型最新版本最常用的一个题目

提示: 帮我制作一个赛朋克贪吃蛇游戏,在单个HTML中运行

这是测试过程

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

这是测试结果,没有任何逻辑错误,也比较好的实现了赛朋克效果,实现效果比R1和Claude 3.7都要好(R1和Claude 的表现我之前的文章有,贪吃蛇游戏虽然很简单,但是加上赛朋克三个字很多新模型实现起来逻辑总是有bug,这里就不作对比了)

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

实测2

这是网友的一个提示词,我看看是否能复刻

提示: Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations: Wind: (e.g., moving clouds, swaying trees, or wind lines) Rain: (e.g., falling raindrops, puddles forming) Sun: (e.g., shining rays, bright background) Snow: (e.g., falling snowflakes, snow accumulating) Show all the weather card side by side The card should have a dark background. Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions (e.g., a function or a set of buttons) to demonstrate the animations for each.

中文:创建一个包含 CSS 和 JavaScript 的 HTML 文件,生成一张动画天气卡片。该卡应以独特的动画直观地表现以下天气状况: 风:(如移动的云、摇摆的树或风线) 雨:(如落下的雨滴、形成的水坑) 太阳:(如闪耀的光芒、明亮的背景) 雪:(如飘落的雪花、积雪) 并排显示所有天气卡片。在此单一文件中提供所有 HTML、CSS 和 JavaScript 代码。JavaScript 应包括在不同天气条件之间切换的方法(例如,一个函数或一组按钮),以演示每种天气条件的动画效果

测试过程:

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

测试结果:完美,完全达到了要求,设计非常精美,细节满满,比如积雪厚度动态效果,高亮每一种天气卡片的按钮,唯一的遗憾是没能够并排显示所有天气卡片,但是整体的指令遵循能力非常强与Claude 3.7相比有过之而无不及

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

这是Claude 3.7 Sonnet的测试过程和结果,大家对比一下,Claude 3.7实现缺少了一些细节,也没有天气卡片的切换按钮

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

我顺便也用同样的提示词测试了一下R1的表现,很明显没有v3的新版本好

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

实测3

这个测试主要是测试模型在极简提示下实现复杂系统的能力

提示:模拟一个太阳系行星运动,在单个HTML中运行

这是测试过程:

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

测试结果也是让我很震惊:比较完美的模拟的太阳系的行星运动,我的提示词里甚至没有对宇宙环境,轨道,行星数量等的细节描述,结果他设置了模拟行星运动三种模式:慢速,标准,加速,土星还有土星环,这都是让我没有想到的

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

同样的提示词,这是R1的测试过程和结果,相对于V3新版本缺少了很多细节

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X

写在最后

时间有限,我只是简单的测试了一下,没有系统性,有网友测试v3 0324的数学能力也很强,大家现在到DeepSeek官网直接就可以测试,纯粹个人感受:小更新大进步!这下更加期待DeepSeek V4和R2了

 


⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~



求赞👇👇
免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部