V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
v2exgo
V2EX  ›  程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

  •  1
     
  •   v2exgo · 9 小时 57 分钟前 · 5035 次点击

    最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

    之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011

    大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

    48 条回复    2026-03-11 20:45:03 +08:00
    wyntalgeer
        1
    wyntalgeer  
       8 小时 15 分钟前
    真有人用中转写代码?
    kfpenn
        2
    kfpenn  
       8 小时 12 分钟前
    @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
    106npo
        3
    106npo  
       8 小时 11 分钟前 via Android
    用中转站就做好会用来被蒸馏的打算呗
    freak118
        4
    freak118  
       8 小时 10 分钟前
    这玩意儿是不是搞个用户协议就完全免责了
    daimaosix
        5
    daimaosix  
       8 小时 7 分钟前
    用开源程序自建的中转自用应该 OK 的吧
    harlen
        6
    harlen  
       8 小时 6 分钟前
    我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
    JoeDH
        7
    JoeDH  
       7 小时 54 分钟前
    我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
    gdkttt
        8
    gdkttt  
       7 小时 35 分钟前
    还是不能贪便宜用中转站,还是老实去买官方的
    xFrye
        9
    xFrye  
       7 小时 33 分钟前
    都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
    LunaSeki
        10
    LunaSeki  
       7 小时 31 分钟前
    用中转都默认会被偷数据吧
    一些 coding plan 也会默认授权用于训练
    augustcc
        11
    augustcc  
       7 小时 22 分钟前
    emm 无所谓的项目用中转。其他我都是用 team
    evamayy
        12
    evamayy  
       7 小时 21 分钟前
    中转一般数据都会上传的吧
    lujiaosama
        13
    lujiaosama  
       6 小时 59 分钟前
    中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
    Lockroach
        14
    Lockroach  
       6 小时 57 分钟前
    总结一下上面内容就是:用中转就做好数据被出售的预期。
    akakcolin
        15
    akakcolin  
       6 小时 54 分钟前
    你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
    VeteranCat
        16
    VeteranCat  
       6 小时 54 分钟前
    现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

    这些中转站更是卖起来毫无心理负担。
    Shielber
        17
    Shielber  
       6 小时 52 分钟前
    我说我的 tg 号怎么用着好好的被封了
    p2007
        18
    p2007  
       6 小时 43 分钟前
    中转站基本没有任何信誉,不跑路就已经很难得了
    everettjf
        19
    everettjf  
       6 小时 36 分钟前
    开源项目写一些倒是无所谓。。。
    tommyshelbyV2
        20
    tommyshelbyV2  
       6 小时 28 分钟前
    用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
    009694
        21
    009694  
       6 小时 23 分钟前 via iPhone
    @freak118 灰产 随时可以跑路 需要什么用户协议😂
    calmbinweijin
        22
    calmbinweijin  
       6 小时 20 分钟前
    我可没有,我纯白,目前已亏 500R
    jiirouwei
        23
    jiirouwei  
       6 小时 9 分钟前
    用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
    cat
        24
    cat  
       6 小时 8 分钟前
    openrouter 和 vercel ai gateway 呢?
    freak118
        25
    freak118  
       6 小时 8 分钟前
    @calmbinweijin 这还能亏吗 中转的成本是啥
    v2exgo
        26
    v2exgo  
    OP
       6 小时 7 分钟前
    @freak118 #25 cdn 服务器 都要钱的
    a1exlism
        27
    a1exlism  
       6 小时 6 分钟前
    用中转就怕这个,所以能自建一定是自建优先的
    yuexiahaowu
        28
    yuexiahaowu  
       5 小时 59 分钟前
    官司的破代码,心里有数,无所谓的
    PC9528
        29
    PC9528  
       5 小时 58 分钟前
    我用第三方中转已经默认会被拿去训练了...
    crime1024
        30
    crime1024  
       5 小时 57 分钟前
    没事 用来养虾额
    lovelive1024
        31
    lovelive1024  
       5 小时 56 分钟前
    中转都是默认没隐私
    calmbinweijin
        32
    calmbinweijin  
       5 小时 53 分钟前
    @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
    poorcai
        33
    poorcai  
       5 小时 35 分钟前
    话说 team 账号现在怎么开通啊?官网没看到
    kfpenn
        34
    kfpenn  
       5 小时 6 分钟前
    @lujiaosama 有啊,cursor 的 share data 还不允许取消
    ano
        35
    ano  
       5 小时 4 分钟前
    @lujiaosama 想什么呢,包被拿去训练的,900%。
    区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
    timeance
        36
    timeance  
       5 小时 0 分钟前
    幸好我用中转都是翻译黄油
    sommio
        37
    sommio  
       4 小时 55 分钟前
    像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
    能降低 API 价格和同时增强国产模型的结果也算还可以了(
    penisulaS
        38
    penisulaS  
       4 小时 43 分钟前
    我的代码怀疑都是污染大模型的
    nbndco
        39
    nbndco  
       4 小时 41 分钟前
    中转就是默认蒸馏啊,只要不在乎就挺好的
    dko
        40
    dko  
       4 小时 29 分钟前
    拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
    dockerhub
        41
    dockerhub  
       4 小时 25 分钟前
    擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
    v2exgo
        42
    v2exgo  
    OP
       4 小时 17 分钟前
    @dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
    Meteora626
        43
    Meteora626  
       4 小时 10 分钟前
    @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
    catazshadow
        44
    catazshadow  
       3 小时 36 分钟前 via Android
    岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
    isnullstring
        45
    isnullstring  
       2 小时 40 分钟前
    用谁都一样,中转卖、官方的自己用
    rfv2
        46
    rfv2  
       2 小时 7 分钟前 via Android
    官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
    unusualcat
        47
    unusualcat  
       1 小时 55 分钟前
    1USDT 50 条会话?这玩意这么值钱啊!
    v2exgo
        48
    v2exgo  
    OP
       1 小时 29 分钟前
    @unusualcat 要那种单次对话的
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3086 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 14:14 · PVG 22:14 · LAX 07:14 · JFK 10:14
    ♥ Do have faith in what you're doing.