https://foodtruckbench.com/blog/deepseek-v4-pro
5 次运行全部成功。中位数投资回报率( ROI )高达 +1,257%。中位数净资产达 $27,142 。 首个跻身 Opus 4.6 、GPT-5.2 和 Grok 4.3 (最新版)同等 ROI 梯队的中国模型; 在所有受测的高级模型中,其运行表现最为出色且稳定性最高。
1
LunarConcerto 10h 10m ago
没看懂这个测试基准是啥
|
2
xmsl 10h 7m ago 只要定语足够多,那就是第一!
|
3
mingtdlb 10h 3m ago 所以这么看,deepseekv4Pro 还不如 GPT5.5Instant
|
4
TimeNewRome 10h 2m ago
不是很明白,这个是回测还是实盘?如果是回测就没什么意义,实盘的话,我将 all in 。
|
5
FantaMole 9h 29m ago
看完了,原来是一套餐车模拟 benchmark ,这个测评内容还蛮有意思的,但我觉得论坛里面大多数人更需要量化模拟 benchmark
不过我觉得这套东西改一改之后可以推销给勇哥餐饮创业说,我觉得来连线的绝大多数都需要这么一套东西来帮他们整理一下脑子里的开店思路 |
6
fuchish112 8h 46m ago
不看,反正官方说了不如 opus4.6 ,我只用来辅助或者交叉验证,写确定的,不复杂的代码用它也足够了
|
7
RuralHunter 7h 55m ago
翻译错了,人家说的是第一个中国顶尖模型,不是中文模型
|
8
jetsung 7h 7m ago
标题的 Chinese 并不是指“中文”吧?我觉得应该指“中国模型”
直接在 Grok 让它总结:“总结一下这篇文章: https://foodtruckbench.com/blog/deepseek-v4-pro” 它说的是“DeepSeek V4 Pro 是首款进入前沿水平的 中国模型( Chinese model ,由中国团队开发)。” 它甚至还拿来跟它家的 Grok 4.3 对比,得出的结论“两者中位净资产和 ROI 非常接近,但 DeepSeek V4 Pro 明显更稳”。笑死。 |
11
TtNnTt 4h 5m ago
v4 难产多久了才发,就第一了
|
12
sampeng 55 mins ago via iPhone
这没意义…要把时间拉长到一年实盘,一进一个不吭声
|