• 请不要在回答技术问题时复制粘贴 AI 生成的内容
sentinelK
V2EX  ›  程序员

阿里百炼的自建 DeepSeek 限速是 TPM 1.2M,这限速是拍脑袋的吗?

  •  
  •   sentinelK · 8h 0m ago · 577 views
    如题,一个 1M 上下文的模型,限速 1 分钟吞吐 1.2M token ,什么 Agent 工具能做到不限速使用?难道是 chat 场景……
    2 replies    2026-05-28 17:54:51 +08:00
    fcten
        1
    fcten  
       7h 21m ago
    因为不觉得有人会用...为什么放着 deepseek 官方的 api 不用用百炼的 api 啊?成本得高几十倍吧...
    百炼的前缀缓存做的稀烂,价格还巨贵。百万上下文的 agent 场景怕是得用破产。
    sentinelK
        2
    sentinelK  
    OP
       7h 18m ago
    @fcten 前几天 deepseek 官方 429 了一阵,于是为了应急,买了百炼的 5 折小包(30 抵 60),结果发现坑的不行。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1316 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 17:13 · PVG 01:13 · LAX 10:13 · JFK 13:13
    ♥ Do have faith in what you're doing.