V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
meetyuan
V2EX  ›  程序员

AI 太烧钱了,有什么好的大模型组合方案?

  •  
  •   meetyuan · 15 小时 39 分钟前 · 6677 次点击

    用 AI 生成计划,写代码,用 claude-opus-4-6 半天烧了四十多,这样下去扛不住。

    我就想能不能使用 claude 或者 gpt 写计划,指定好详细的开发计划和实施流程,然后让 minimax(我买了一个月的 plus ,放那里快到期了)来完成实施过程以及测试?

    各位高手有什么建议没有?

    93 条回复    2026-04-21 21:57:48 +08:00
    YanSeven
        1
    YanSeven  
       15 小时 38 分钟前
    直接用的 claude 的 api 吗,那确实烧
    WessonC
        2
    WessonC  
       15 小时 35 分钟前
    只能中转站,但是现在中转站太 JB 乱了。
    iorilu
        3
    iorilu  
       15 小时 34 分钟前   ❤️ 3
    很多人是这么做的阿

    但是, 即使你拆的很细, 差的模型也不保证能无错完成

    这就看你取舍了, 你愿意多花时间, 甚至自己可以直接改代码的, 可以用

    如果你做不了, 那只能多花钱
    fingerxie
        4
    fingerxie  
       15 小时 33 分钟前
    我是用的 codex ,感觉不错。 大体来讲一个月 20 美刀的版本略微不够,配合公司提供的 cursor+阿里云 coding plan 刚好覆盖
    meetyuan
        5
    meetyuan  
    OP
       15 小时 25 分钟前
    @WessonC
    @YanSeven 用的中转,充了 40 ,大半天就没了,倍率也没有多高,实在扛不住了
    ooooo00000ooooo
        6
    ooooo00000ooooo  
       15 小时 23 分钟前
    就是主楼说的那样搞啊,不过不要用 Minimax ,用 GLM
    66beta
        7
    66beta  
       15 小时 22 分钟前
    试试 deepseek API ,我试了下,只看做计划,写代码的话,跟 CLAUDE 差别不大,价格那就是降维打击了
    hnbcinfo
        8
    hnbcinfo  
       15 小时 19 分钟前
    用 Claude Code Router ,把不同的任务分给不同的大模型,应该能节省成本,不过我没测试过。
    sampeng
        9
    sampeng  
       15 小时 14 分钟前
    实话说。。我也是这样做的。但你会发现 plan 也很花钱
    Sundayz
        10
    Sundayz  
       15 小时 3 分钟前
    从官方订阅,再到中转站,最后 Trae CN 白嫖免费模型,一路走下来并没有感觉到使用顶级模型的必要性,免费的模型一样能够完成工作。
    meetyuan
        11
    meetyuan  
    OP
       15 小时 3 分钟前
    @sampeng 我今天测试了,做计划确实也烧钱,但是还在接收的范围内,之前写代码和做测试,烧 token 太厉害了
    mnoputd20adfadf3
        12
    mnoputd20adfadf3  
       14 小时 58 分钟前
    高频用 GPT(敞开用)
    可以看看 我自用的 中转 aHR0cHM6Ly81ODUwMTZkMy51M3UuZGV2Lw==
    (pro + plus 号池)
    同行、看着出吧(毕竟奥特曼 经常重置额度)
    适合同行分摊成本,不做商业服务
    yiiouo
        13
    yiiouo  
       14 小时 57 分钟前
    公司有买 cursor ,一个月能用 100 美元吧,然后我自己买了 kimi ,配合 opencode 效果还可以。
    Sezxy
        14
    Sezxy  
       14 小时 53 分钟前
    腾讯云的 coding plan lite 40 元,虽然模型不是最新,但处理 crud 绰绰有余
    mnoputd20adfadf3
        15
    mnoputd20adfadf3  
       14 小时 43 分钟前
    @mnoputd20adfadf3
    刚刚注册的一个用户
    送了 一百刀 用于体验(没有倍率,和官方一样计价的)
    奥特曼,重置额度了,余量多

    薅羊毛用户,请去 商业化中转站 谢谢 ~
    请留给真有使用需求的(且高频用的)
    后续注册
    可在站内 @我 送体验额度
    YangWaleed
        16
    YangWaleed  
       14 小时 41 分钟前
    本来可以推荐 copilot 的,现在也没了
    总体上看订阅比 API 便宜,我之前是 codex + copilot 勉强够用,现在可能得两个 codex 了
    ntdll
        17
    ntdll  
       14 小时 39 分钟前
    通常是用大模型做规划和最后的审查 code review ,而小模型负责根据规划文档编码,这样可以节约 token
    AnQiYang
        18
    AnQiYang  
       14 小时 36 分钟前
    @66beta 你认真的嘛,感觉这么不现实呢
    cookii
        19
    cookii  
       14 小时 17 分钟前 via Android
    @66beta deepseek 还是差距太大了,至少也得拿 kimi 吧
    AlohaV2
        20
    AlohaV2  
       14 小时 10 分钟前
    别充年费,等等 ds
    herofire
        21
    herofire  
       14 小时 7 分钟前
    @mnoputd20adfadf3 已注册,求体验额度
    66beta
        22
    66beta  
       14 小时 6 分钟前
    @AnQiYang #18 不信就自己试一下嘛,反正我用下来差距并不大。也用了大半年了,现在公司买了 CLAUDE 我就慢慢不用了
    mnoputd20adfadf3
        23
    mnoputd20adfadf3  
       14 小时 5 分钟前
    @herofire 邮箱是多少
    base 加密发一下 谢谢
    Ethan24067
        24
    Ethan24067  
       14 小时 3 分钟前
    我自用的是 opencode 加 omo 插件,这个插件把任务细分为多个部件,你对于每个部件可以分别配置模型,这样的话,就能拆开了。类似的还有 claude code 里的 ccg-workflow ,前端派给 gemini ,后端扔给 codex ,claude 桥接和规划。
    mnoputd20adfadf3
        25
    mnoputd20adfadf3  
       14 小时 3 分钟前
    @herofire 看到你过往 回复记录了 ...
    不用邮箱了
    106npo
        26
    106npo  
       14 小时 1 分钟前 via Android
    minimax 太小了,glm 或者 kimi 吧
    mansunyunxin
        27
    mansunyunxin  
       13 小时 20 分钟前
    你问的方向是对的,但 Minimax 做执行层降级太多。更好的组合是:

    DeepSeek/GLM 做具体执行,Claude 只做规划 + 审查。

    这本质上是 Karpathy 「 Goal-Driven Execution 」的成本感知版本——不只是给目标,还要给「在什么成本约束下达到目标」。

    规划的 token 消耗经常被低估。实际上更好的分法是:
    - 大模型:规划路径 + 审查代码质量
    - 便宜模型:按规划路径执行

    DeepSeek 写代码和 Claude 差距没那么大,但价格是降维打击。省下来的预算可以多跑几轮规划。
    shea
        28
    shea  
       13 小时 14 分钟前
    @mnoputd20adfadf3 #25 大佬,我也注册了,求体验额度,c2hlYW9vY0BnbWFpbC5jb20=
    mnoputd20adfadf3
        29
    mnoputd20adfadf3  
       12 小时 55 分钟前
    @shea 已 赠送
    wengjin456123
        30
    wengjin456123  
       12 小时 34 分钟前
    @mansunyunxin ds 的 128k 上下文是不是太小了
    Elio
        31
    Elio  
       12 小时 33 分钟前
    我用的中转站 codex ,一个月才差不多四五十
    exploretheworld
        32
    exploretheworld  
       12 小时 20 分钟前
    找个能随便用的公司上班
    Panameragt
        33
    Panameragt  
       12 小时 14 分钟前
    openrouter/free
    linecode
        34
    linecode  
       11 小时 56 分钟前
    @mnoputd20adfadf3 大佬,注册了,来个体验额度,OTE1OTIxNTAwQHFxLmNvbQ==
    mnoputd20adfadf3
        35
    mnoputd20adfadf3  
       11 小时 51 分钟前
    @linecode 已 处理
    mpthink
        36
    mpthink  
       11 小时 47 分钟前
    @mnoputd20adfadf3 大佬,注册了 bXB0aGluazoxNjMuY29t
    s0f
        37
    s0f  
       11 小时 39 分钟前
    @mnoputd20adfadf3 大佬,注册了 MzE2MDI0NzYzQHFxLmNvbQ==,谢谢
    mnoputd20adfadf3
        38
    mnoputd20adfadf3  
       11 小时 31 分钟前
    @mpthink
    @s0f
    都处理了
    wangmn
        39
    wangmn  
       11 小时 30 分钟前
    可以试试我主页的中转 可以敞开用
    cryzzchen
        40
    cryzzchen  
       11 小时 15 分钟前
    @YangWaleed copilot 也没了?
    YangWaleed
        41
    YangWaleed  
       11 小时 5 分钟前
    @cryzzchen 不让新用户订阅了,而且 opus 额度大砍,要想用 opus 可能还是 Claude 官方便宜
    之前用 copilot 主要是为了 opus ,现在感觉不值得了
    jimrok
        42
    jimrok  
       10 小时 55 分钟前
    海外模型可以做一下任务制定,规格说明,给出样例代码,国产模型负责实现设计。写代码可以试试 GLM 和 kimi ,有指引的情况下,应该出来的内容不会太差。
    wanghanthu
        43
    wanghanthu  
       10 小时 32 分钟前
    老黄:The more you buy, the more you save.
    wu67
        44
    wu67  
       10 小时 32 分钟前
    @YangWaleed 不用 opus 用用 4.6 倒也还行.
    但是看到有人说会把月次数限制成周次数? 那就很尴尬了, 不过我没看到在哪有官方声明, 不知道他在哪看来的.
    YangWaleed
        45
    YangWaleed  
       10 小时 17 分钟前
    @wu67 不确定。我感觉 sonnet 4.6 是不是没 gpt-5.4 强? copilot 里这两个消耗一样,那我肯定优先用 gpt-5.4 。
    我自己感觉两个 openai plus 订阅的量够我轮换地用了,再订阅 copilot 好像有点鸡肋
    zihaogong
        46
    zihaogong  
       10 小时 14 分钟前
    @mnoputd20adfadf3 #38 NjM1NTY1OTkwQHFxLmNvbQ== 感谢
    mnoputd20adfadf3
        47
    mnoputd20adfadf3  
       10 小时 12 分钟前
    @zihaogong 已处理
    wu67
        48
    wu67  
       10 小时 12 分钟前
    @YangWaleed 我一直用 4.6, 聪明程度足够我用了. 以前 gpt5 刚出的时候我被坑过, 就再也没启用过 gpt 系列的了, 除了一个 gpt4.1 用来在高级请求耗尽时备用.
    YangWaleed
        49
    YangWaleed  
       10 小时 6 分钟前
    @wu67 我倒是反过来。一开始用 sonnet 和 opus ,后来发现 gpt-5.4 好像能力上相差无几但用量多很多,就慢慢迁移到 gpt 了。不过后来 codex 用量砍了后也撑不住我用 superpowers ,得两个号混着用才行
    wu67
        50
    wu67  
       10 小时 1 分钟前
    @YangWaleed 5.4 还有越界到处修改代码的问题吗? 不频繁的话我也试试看
    abc0123xyz
        51
    abc0123xyz  
       10 小时 1 分钟前
    别用 弱智 max ,跑个龙虾还凑合,写代码太拉了
    TheAnonymous
        52
    TheAnonymous  
       10 小时前
    @mnoputd20adfadf3 求体验额度 OTkzNTM3MTc4QHFxLmNvbQ==
    mnoputd20adfadf3
        53
    mnoputd20adfadf3  
       9 小时 58 分钟前
    @TheAnonymous 已处理
    imnpc
        54
    imnpc  
       9 小时 57 分钟前
    kimi + gpt
    YangWaleed
        55
    YangWaleed  
       9 小时 53 分钟前
    @wu67 我没感觉到有这种情况。不过我也不会仔细 review 代码改动,只确认修改方案。
    superpowers skills 会起一个 subagent 写代码,两个 subagent 分别 review 修改逻辑和代码质量。所以额度会肉眼可见地掉,现在我都会强调不需要这么严格的 review 才好点
    fongyip
        56
    fongyip  
       9 小时 30 分钟前 via Android
    @mnoputd20adfadf3
    哥方便给个体验额度吗?
    Zm9uZ3lpcDIwMjNAMTYzLmNvbQ==
    mnoputd20adfadf3
        57
    mnoputd20adfadf3  
       9 小时 24 分钟前
    @fongyip 已处理
    sarices
        58
    sarices  
       9 小时 22 分钟前
    @mnoputd20adfadf3 #23

    来点测试 cHJldHR5NTIzMkAxMjA3MjkueHl6
    mnoputd20adfadf3
        59
    mnoputd20adfadf3  
       9 小时 21 分钟前
    @sarices 已处理
    fuchish112
        60
    fuchish112  
       9 小时 17 分钟前
    @mnoputd20adfadf3 c29yc2hpb25AZ21haWwuY29t 大佬
    rsyjjsn
        61
    rsyjjsn  
       9 小时 10 分钟前
    用 proxifier + antigravity 直接薅谷歌的,强度不高 一周三个谷歌号,强度高你就一天一个号,反正 7 天之后就重置额度了
    justforvx
        62
    justforvx  
       9 小时 10 分钟前
    @mnoputd20adfadf3 R2F6aW5nMjgyN0AxNjMuY29t 感谢大佬
    mnoputd20adfadf3
        63
    mnoputd20adfadf3  
       9 小时 7 分钟前
    @fuchish112
    @justforvx
    已处理
    xinshu
        64
    xinshu  
       9 小时 0 分钟前
    @mnoputd20adfadf3 d2hvaXMueGluc2h1QGdtYWlsLmNvbQ== 感谢大佬
    thedustoooo
        65
    thedustoooo  
       8 小时 58 分钟前
    @mnoputd20adfadf3 ZGVzdGlueW9vb29AMTI2LmNvbQ== 大佬
    luckyxl
        66
    luckyxl  
       8 小时 54 分钟前
    @mnoputd20adfadf3 7CefPvGBexCUijc6JXHoAk 感谢大佬
    PPZZPP
        67
    PPZZPP  
       8 小时 51 分钟前
    @mnoputd20adfadf3 大佬,注册了 YTEzMjc5MzkxNTdAZ21haWwuY29t
    ThunStorm
        68
    ThunStorm  
       8 小时 49 分钟前 via Android
    @mnoputd20adfadf3 ZjE1MTV4Y25AZ21haWwuY29t 感谢大佬
    luckyxl
        69
    luckyxl  
       8 小时 48 分钟前
    @mnoputd20adfadf3 Mjc5NDc0Mzg2QHFxLmNvbQ== 感谢大佬
    meetyuan
        70
    meetyuan  
    OP
       8 小时 46 分钟前   ❤️ 1
    @mnoputd20adfadf3 哥,感谢你的回复,要不你在开个推广帖子吧,我一定支持!

    我这里主要是想讨论下怎么多模型配合使用,现在有点乱了。
    luck2023
        71
    luck2023  
       8 小时 42 分钟前 via Android
    @mnoputd20adfadf3 注册好了,Y29uZmlkZW5jZXMyMDIzQGdtYWlsLmNvbQ==
    mnoputd20adfadf3
        72
    mnoputd20adfadf3  
       8 小时 38 分钟前
    @meetyuan 不好意思哈 🤡
    么么哒 ~

    请不要在 @ 我了
    余量也不够了
    感恩 🥹 🥹 🥹
    program9527
        73
    program9527  
       8 小时 35 分钟前
    最近看了下视频生成的。google 的 veo ,sora 、即梦好像价格都非常高。有什么低成本的方案吗
    lodelo
        74
    lodelo  
       8 小时 33 分钟前
    @mnoputd20adfadf3 MTc1ODQzNzY3QHFxLmNvbQ== 感谢大佬
    wclebb
        75
    wclebb  
       8 小时 30 分钟前
    认真讲,如果你能用大模型免费写代码,那么就没有这个岗位了。
    ls006009
        76
    ls006009  
       8 小时 24 分钟前
    @mnoputd20adfadf3 大佬, 注册好了, 求体验额度, bHMwMDYwQDE2My5jb20= 谢谢
    zhangdashuan
        77
    zhangdashuan  
       8 小时 22 分钟前
    @mnoputd20adfadf3 #12 大佬,已注册,求体验额度。MzIwMDI0MTE0MkBxcS5jb20=
    vincentwu
        78
    vincentwu  
       8 小时 8 分钟前
    @mnoputd20adfadf3 大佬已注册,d3lsd2lsbDAyMTJAMTYzLmNvbQ==
    kevan
        79
    kevan  
       8 小时 5 分钟前
    @mnoputd20adfadf3 我注册了 ID: am95bXVzaWNAMTYzLmNvbQo=
    teaguexiao
        80
    teaguexiao  
       7 小时 55 分钟前
    用 Claude Code 的话可以在 CLAUDE.md 里将需求和架构写详细,让 Sonnet 做执行,只在关键定义和架构评审时再切回 Opus ,这样一天的费用能控在十块内。
    XUEHAIWUYA
        81
    XUEHAIWUYA  
       7 小时 37 分钟前
    找个正规的中转,或者 token 是不是确实用的多
    Lutto
        82
    Lutto  
       7 小时 33 分钟前
    我半天用了 100 美金的 token……
    chenzezeya
        83
    chenzezeya  
       7 小时 33 分钟前
    哥方便来点~ NDQ4MTY1MzE1QHFxLmNvbQ==
    @mnoputd20adfadf3
    gaoxiaoxin
        84
    gaoxiaoxin  
       7 小时 25 分钟前
    MTUwOTQzNDY3NGdhb0BnbWFpbC5jb20= 感谢大佬 @mnoputd20adfadf3
    soFollish
        85
    soFollish  
       7 小时 17 分钟前
    emh1YW5nemh1YW5nemhvdWlAZ21haWwuY29t 感谢老板 @mnoputd20adfadf3
    sarices
        86
    sarices  
       6 小时 23 分钟前   ❤️ 1
    @mnoputd20adfadf3 #59
    速度还可以,挺不错的,用一段时间看看
    mach9452
        87
    mach9452  
       5 小时 51 分钟前
    贵就对了,我还没失业就是因为 AI 比我贵[doge/]
    mackes
        88
    mackes  
       5 小时 24 分钟前
    @mnoputd20adfadf3 老哥,刚注册了一个用户名 mackes
    mackes
        89
    mackes  
       5 小时 22 分钟前
    @Elio 老哥可以分享一下吗?
    hais1992
        90
    hais1992  
       5 小时 18 分钟前
    @mnoputd20adfadf3 aGFpczE5OTJAMTYzLmNvbQ== 求体验额度,已注册,多谢大佬~
    gotoschool
        91
    gotoschool  
       5 小时 12 分钟前
    @mackes #89 留联系方式
    mackes
        92
    mackes  
       4 小时 58 分钟前
    @gotoschool bWFja2VzNzRAZ21haWwuY29t 谢谢
    distance7509
        93
    distance7509  
       4 小时 2 分钟前
    我感觉中转站的话,还不如官方拼车,中转站的消耗太快了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1141 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 255ms · UTC 18:00 · PVG 02:00 · LAX 11:00 · JFK 14:00
    ♥ Do have faith in what you're doing.