V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
v2exgo
V2EX  ›  程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

  •  3
     
  •   v2exgo · 15 小时 52 分钟前 · 5999 次点击

    最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

    之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.sunp.eu.org/t/1196011

    大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

    53 条回复    2026-03-12 02:01:01 +08:00
    wyntalgeer
        1
    wyntalgeer  
       14 小时 10 分钟前
    真有人用中转写代码?
    kfpenn
        2
    kfpenn  
       14 小时 6 分钟前
    @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
    106npo
        3
    106npo  
       14 小时 5 分钟前 via Android
    用中转站就做好会用来被蒸馏的打算呗
    freak118
        4
    freak118  
       14 小时 5 分钟前
    这玩意儿是不是搞个用户协议就完全免责了
    daimaosix
        5
    daimaosix  
       14 小时 2 分钟前
    用开源程序自建的中转自用应该 OK 的吧
    harlen
        6
    harlen  
       14 小时 1 分钟前
    我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
    JoeDH
        7
    JoeDH  
       13 小时 49 分钟前
    我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
    gdkttt
        8
    gdkttt  
       13 小时 30 分钟前
    还是不能贪便宜用中转站,还是老实去买官方的
    xFrye
        9
    xFrye  
       13 小时 27 分钟前
    都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
    LunaSeki
        10
    LunaSeki  
       13 小时 25 分钟前
    用中转都默认会被偷数据吧
    一些 coding plan 也会默认授权用于训练
    augustcc
        11
    augustcc  
       13 小时 17 分钟前
    emm 无所谓的项目用中转。其他我都是用 team
    evamayy
        12
    evamayy  
       13 小时 16 分钟前
    中转一般数据都会上传的吧
    lujiaosama
        13
    lujiaosama  
       12 小时 54 分钟前
    中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
    Lockroach
        14
    Lockroach  
       12 小时 52 分钟前
    总结一下上面内容就是:用中转就做好数据被出售的预期。
    akakcolin
        15
    akakcolin  
       12 小时 49 分钟前
    你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
    VeteranCat
        16
    VeteranCat  
       12 小时 49 分钟前
    现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

    这些中转站更是卖起来毫无心理负担。
    Shielber
        17
    Shielber  
       12 小时 46 分钟前
    我说我的 tg 号怎么用着好好的被封了
    p2007
        18
    p2007  
       12 小时 37 分钟前
    中转站基本没有任何信誉,不跑路就已经很难得了
    everettjf
        19
    everettjf  
       12 小时 30 分钟前
    开源项目写一些倒是无所谓。。。
    tommyshelbyV2
        20
    tommyshelbyV2  
       12 小时 23 分钟前
    用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
    009694
        21
    009694  
       12 小时 18 分钟前 via iPhone
    @freak118 灰产 随时可以跑路 需要什么用户协议😂
    calmbinweijin
        22
    calmbinweijin  
       12 小时 15 分钟前
    我可没有,我纯白,目前已亏 500R
    jiirouwei
        23
    jiirouwei  
       12 小时 4 分钟前
    用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
    cat
        24
    cat  
       12 小时 3 分钟前
    openrouter 和 vercel ai gateway 呢?
    freak118
        25
    freak118  
       12 小时 3 分钟前
    @calmbinweijin 这还能亏吗 中转的成本是啥
    v2exgo
        26
    v2exgo  
    OP
       12 小时 2 分钟前
    @freak118 #25 cdn 服务器 都要钱的
    a1exlism
        27
    a1exlism  
       12 小时 1 分钟前
    用中转就怕这个,所以能自建一定是自建优先的
    yuexiahaowu
        28
    yuexiahaowu  
       11 小时 54 分钟前
    官司的破代码,心里有数,无所谓的
    PC9528
        29
    PC9528  
       11 小时 53 分钟前
    我用第三方中转已经默认会被拿去训练了...
    crime1024
        30
    crime1024  
       11 小时 52 分钟前
    没事 用来养虾额
    lovelive1024
        31
    lovelive1024  
       11 小时 51 分钟前
    中转都是默认没隐私
    calmbinweijin
        32
    calmbinweijin  
       11 小时 48 分钟前
    @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
    poorcai
        33
    poorcai  
       11 小时 30 分钟前
    话说 team 账号现在怎么开通啊?官网没看到
    kfpenn
        34
    kfpenn  
       11 小时 1 分钟前
    @lujiaosama 有啊,cursor 的 share data 还不允许取消
    ano
        35
    ano  
       10 小时 59 分钟前
    @lujiaosama 想什么呢,包被拿去训练的,900%。
    区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
    timeance
        36
    timeance  
       10 小时 55 分钟前
    幸好我用中转都是翻译黄油
    sommio
        37
    sommio  
       10 小时 50 分钟前
    像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
    能降低 API 价格和同时增强国产模型的结果也算还可以了(
    penisulaS
        38
    penisulaS  
       10 小时 37 分钟前
    我的代码怀疑都是污染大模型的
    nbndco
        39
    nbndco  
       10 小时 36 分钟前
    中转就是默认蒸馏啊,只要不在乎就挺好的
    dko
        40
    dko  
       10 小时 24 分钟前
    拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
    dockerhub
        41
    dockerhub  
       10 小时 20 分钟前
    擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
    v2exgo
        42
    v2exgo  
    OP
       10 小时 12 分钟前
    @dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
    Meteora626
        43
    Meteora626  
       10 小时 5 分钟前
    @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
    catazshadow
        44
    catazshadow  
       9 小时 31 分钟前 via Android
    岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
    isnullstring
        45
    isnullstring  
       8 小时 35 分钟前
    用谁都一样,中转卖、官方的自己用
    rfv2
        46
    rfv2  
       8 小时 1 分钟前 via Android
    官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
    unusualcat
        47
    unusualcat  
       7 小时 50 分钟前
    1USDT 50 条会话?这玩意这么值钱啊!
    v2exgo
        48
    v2exgo  
    OP
       7 小时 23 分钟前
    @unusualcat 要那种单次对话的
    aarontian
        49
    aarontian  
       5 小时 3 分钟前
    能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
    goodboy95
        50
    goodboy95  
       4 小时 37 分钟前 via Android
    我连用官方的都默认数据全交出去了
    ideard
        51
    ideard  
       4 小时 34 分钟前
    还好我是自建,免费的东西代价太大了
    JoshTheLegend
        52
    JoshTheLegend  
       3 小时 43 分钟前
    别说中转了,用官方的不都是默认全交的吗...
    unixcs
        53
    unixcs  
       2 小时 8 分钟前 via Android
    比起我的数据,我更想省点 token 的钱
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   972 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 20:09 · PVG 04:09 · LAX 13:09 · JFK 16:09
    ♥ Do have faith in what you're doing.