计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。
不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。
目前用的是 mimo v2.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。
计算了一下批量任务大概需要 500 亿左右,输入输出比大概在 20:1 ,需要 deepseek v4 pro 及以上智商的模型。
不知道有没有比较熟悉各种 tokenplan 的老哥指条路,谁家比较便宜。
目前用的是 mimo v2.5 pro 的 tokenplan ,估算了一下要几千块钱,还是很贵啊。。。
1
imlonghao 1 day ago
别单算输入输出比,缓存率也得考虑啊
|
2
soulflysimple123 1 day ago
opencode go
|
3
Censhuang 1 day ago
给个方向:租算力去自己推理?
|
4
rotor1996 1 day ago via iPhone
中转站啊
|
5
qili36585009 1 day ago
推荐你用中转站的 gpt5.4 相对来说还是很便宜的
|
6
wuxkwnjjwoxk 1 day ago via iPhone
收雷总送的 mimo 额度呀,我 max plan 还有 900 亿 credit ,可出
|
7
rubi 1 day ago
来用中转站吧
|
8
afkool 1 day ago
中转呗。。当然自己买 Pro20 最划算。
|
9
huahuaccc 1 day ago
500 亿 token ,中转也便宜不到几千块啊
|
10
LeeReamond OP |
11
noqwerty 1 day ago
试一下这个缓存率也很低吗 https://github.com/esengine/deepseek-reasonix
|
12
sakurajiayou PRO 看看我之前发的几个贴子,肯定能解决你的问题
|
13
106npo 1 day ago via Android
缓存率这么低的话,minimax 吧,预计 3000 多,但你得用一个月跑
|
14
409164 1 day ago via iPhone
mbp 本地模型考虑一下?
|
15
sNullp 1 day ago
selfhost?
|
16
night98 1 day ago
opencode go 套餐?多开几个号组个号池?你这也不多啊关键是。或者直接 team 号几块钱一个买个一百个慢慢跑
|
17
DeadLion 1 day ago
智谱去租老套餐的 MAX 账号 ,没有周限额的话,5h 估算能跑 7.5 个亿
|
18
maolon 1 day ago 为什么不用 batch api 来做,就算只走各家官方的 batch api ,价格正常来说也是普通 api 的 1/10 ,基本等于全程缓存的价格
|
19
Meteora626 1 day ago
最近几天 无限 team ,遍地免费的 gpt5.5 不登起来?
|
20
sillydaddy 23h 47m ago
是不是算错了?我算着应该是几万块钱。
「缓存率看了一下 10%左右」,再加上「输入输出是 20:1 」这相当于 500 亿 token 几乎都是输入 token 了!就算按 mimo-v2.5 或者 deepseek v4 flash 的低价( 1 块/百万 token ),也是 50000 个「百万 token 」,即 5 万块钱!不是你说的几千块。更何况用 pro 版还要加几倍。 |
21
sillydaddy 23h 41m ago
如果是**检索信息**而不是**全量处理文档**,有没有可能改进一下流程?即,不要把所有的内容,都作为输入 token ,这样太消耗了!可以使用工具+ReACT 模式,去递进的搜索、提取。
这是我在做的项目,试了下,相比之前,感觉能把成本减少 90%以上: /t/1215475 |
22
afkool 21h 35m ago
@LeeReamond 中转是把订阅转成 api 卖,当然便宜了。至少现阶段,gpt 系列没有人以次充好。
人品差的可能会植入一些恶意提示词获取密钥之类的。所以用的时候注意一下权限管理,防人之心不可无。 |
23
andyskaura 18h 48m ago
@DeadLion 你想多了,老套餐现在能联通一次都不容易。降权降得厉害
|
24
DeadLion 18h 44m ago
@andyskaura 除了刚出 5.1 那会儿限流 429 后面没遇到过 昨天好几个账号都跑满了 消耗 7 个亿
日常也都 2 亿 token 快的很 |
25
andyskaura 18h 38m ago
@DeadLion #24 那估计是我的账号太早了?去年 10 月份的订阅,今年过完年基本就无法使用了。10 个需求只能正常回复 2 个。
|
26
defunct9 18h 14m ago
team bug 号,还可以继续薅
|
27
MeAndRhythm 18h 9m ago
我用的是免费账户 mimo v2.5 pro 免费额度还有几百亿这个月 19 号过期过期不介意的话你可以低价收走
|
28
MeAndRhythm 18h 9m ago
@MeAndRhythm 6,057,316,608 / 82,000,000,000
已使用 7.0% |
29
DeadLion 17h 48m ago
@andyskaura #25 感觉可能跟姿势有关 要么就是你号黑了 我 1 月份的也是老账号
|
30
Lexin914 17h 22m ago
@qili36585009 老哥有没有速度快的中转站推荐
|
31
LeeReamond OP @maolon 我看官方价格 batch api 只是 50%off ,老哥怎么搞的 1/10 价格呢。
@sillydaddy 目前是低价收的账号,不是走原价 @MeAndRhythm 老哥哪个区的,目前限流问题怎么样。我有几个新加坡区的现在只能单线程调用了,非常糟糕。能并发的话倒是有兴趣 |
32
guanhui07 13h 49m ago
中转站
|