V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
cjtree04
V2EX  ›  程序员

我们自己写了个 API 中转站的检测工具

  •  
  •   cjtree04 · 21h 52m ago · 699 views

    我们团队正在做 AI 基础设施方向的工作,日常需要系统性评测各类中转站的可靠性,帮助内部项目做选型决策。 市面上的评测大多是"能不能连上"、"速度怎么样",但对我们来说更关键的问题是:这个接口背后到底在跑什么?有没有在请求或响应上动手脚? 为了把这件事做系统,我们写了 Probe Kit 。输入一个 OpenAI-compatible 接口的 Base URL 、API Key 和模型 ID ,跑 9 大类检测:

    1. 模型身份——实际跑的是不是你以为的那个模型
    2. 提示词完整性——system prompt 和护栏有没有被剥离
    3. 协议规范——stop sequence 、采样参数等是否真实透传
    4. 工具调用——tool_calls 结构有没有被改写
    5. 上下文窗口——长上下文是否被截断
    6. 缓存与流式——本否伪流式、缓存重放
    7. 计费——usage 、token 数是否可信
    8. 安全——会话隔离、凭据泄漏、隐藏追踪载荷
    9. 性能——TTFT 、延迟、吞吐量 说明一下费用:检测过程会产生实际 API 调用,以 Opus 4.5 级别的模型为例,跑一次完整检测的 token 消耗约 0.5 美元,时间约 3-5 分钟。建议用临时 Key ,跑完删掉。

    官网: https://probe-dev.commonstack.ai

    如果你也在评估中转站,欢迎聊聊测出的结果,或者来官网直接试用。

    musi
        1
    musi  
       12h 31m ago via iPhone   ❤️ 1
    中转站不会那么傻,每次请求都给你用垃圾模型,只会给你掺水,比例不等,不是你测试时发几次请求就能测出来的,跑大量测试又会真花钱
    musi
        2
    musi  
       12h 29m ago via iPhone
    @musi 另外很多中转站不一定是直连的,上游可能有好几个类似的中转站,他们也需要做路由调度,上游之上还有上游。而且就算你测试时通过,他们也会接新的上游,这个质量不稳定的
    leoking6
        3
    leoking6  
       8h 59m ago
    需要邀请码?是我打开姿势不对吗
    cjtree04
        4
    cjtree04  
    OP
       8h 12m ago
    @leoking6 给我个邮箱
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2441 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 53ms · UTC 11:39 · PVG 19:39 · LAX 04:39 · JFK 07:39
    ♥ Do have faith in what you're doing.