V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
v2exgo
V2EX  ›  程序员

用中转站的千万要小心,已经有人在 tg 大量购买用户数据用于训练

  •  6
     
  •   v2exgo · Mar 11 · 13036 views
    This topic created in 56 days ago, the information mentioned may be changed or developed.

    最近站点做起来了,有人已经开始找我买用户数据了,这个很容易闹成法律纠纷,我这边果断还是拒绝了

    之前的帖子里面讲了,模型蒸馏产业链、以及用中转站的注意事项 https://cn.v2ex.com/t/1196011

    大家还是使用中转的时候 还是要多多留意,关键 key 跟私钥 一定要放置到 agent 不能读取的目录里面,防止被坏人利用

    79 replies    2026-04-08 19:34:03 +08:00
    wyntalgeer
        1
    wyntalgeer  
       Mar 11
    真有人用中转写代码?
    kfpenn
        2
    kfpenn  
       Mar 11
    @wyntalgeer 额,那用中转做什么?大部分中转好像只能 cc 用
    106npo
        3
    106npo  
       Mar 11 via Android
    用中转站就做好会用来被蒸馏的打算呗
    freak118
        4
    freak118  
       Mar 11
    这玩意儿是不是搞个用户协议就完全免责了
    daimaosix
        5
    daimaosix  
       Mar 11
    用开源程序自建的中转自用应该 OK 的吧
    harlen
        6
    harlen  
       Mar 11
    我还以为你会告诉我们,你们服务,这种数据服务器马上就删了,根本没得卖
    JoeDH
        7
    JoeDH  
       Mar 11
    我就说现在怎么那么多免费公益中转站,额度全跟不要钱式的往外送,特别是隔壁冒出来一大堆
    gdkttt
        8
    gdkttt  
       Mar 11
    还是不能贪便宜用中转站,还是老实去买官方的
    xFrye
        9
    xFrye  
       Mar 11
    都用中转了,默认数据就是被人拿来用的,以及中转服务随时跑路
    LunaSeki
        10
    LunaSeki  
       Mar 11
    用中转都默认会被偷数据吧
    一些 coding plan 也会默认授权用于训练
    augustcc
        11
    augustcc  
       Mar 11
    emm 无所谓的项目用中转。其他我都是用 team
    evamayy
        12
    evamayy  
       Mar 11
    中转一般数据都会上传的吧
    lujiaosama
        13
    lujiaosama  
       Mar 11
    中转就不说了. TRAE, CURSOR,CODEBUDDY 这种 AI IDE 会不会有被拿去训练的风险呢?
    Lockroach
        14
    Lockroach  
       Mar 11
    总结一下上面内容就是:用中转就做好数据被出售的预期。
    akakcolin
        15
    akakcolin  
       Mar 11
    你只要用大模型了,数据就给大模型了,直连是这样的,用中转也是一样的,默认数据就是被人拿来用
    VeteranCat
        16
    VeteranCat  
       Mar 11
    现阶段,这些免费供你使用的模型哪个不是打算偷你的数据呢?

    这些中转站更是卖起来毫无心理负担。
    Shielber
        17
    Shielber  
       Mar 11
    我说我的 tg 号怎么用着好好的被封了
    p2007
        18
    p2007  
       Mar 11
    中转站基本没有任何信誉,不跑路就已经很难得了
    everettjf
        19
    everettjf  
       Mar 11
    开源项目写一些倒是无所谓。。。
    tommyshelbyV2
        20
    tommyshelbyV2  
       Mar 11
    用吧用吧,反正也不值钱,价格便宜就好。官方一样是要被拿去蒸馏,卖谁不是卖
    009694
        21
    009694  
       Mar 11 via iPhone
    @freak118 灰产 随时可以跑路 需要什么用户协议😂
    calmbinweijin
        22
    calmbinweijin  
       Mar 11
    我可没有,我纯白,目前已亏 500R
    jiirouwei
        23
    jiirouwei  
       Mar 11
    用了别人的东西就得做好用户数据被拿来做其他事的可能,退一步来说,都是公司的代码,就算是泄露了,与我个人也没什么关系😄
    cat
        24
    cat  
       Mar 11
    openrouter 和 vercel ai gateway 呢?
    freak118
        25
    freak118  
       Mar 11
    @calmbinweijin 这还能亏吗 中转的成本是啥
    v2exgo
        26
    v2exgo  
    OP
       Mar 11
    @freak118 #25 cdn 服务器 都要钱的
    a1exlism
        27
    a1exlism  
       Mar 11
    用中转就怕这个,所以能自建一定是自建优先的
    yuexiahaowu
        28
    yuexiahaowu  
       Mar 11
    官司的破代码,心里有数,无所谓的
    PC9528
        29
    PC9528  
       Mar 11
    我用第三方中转已经默认会被拿去训练了...
    crime1024
        30
    crime1024  
       Mar 11
    没事 用来养虾额
    lovelive1024
        31
    lovelive1024  
       Mar 11
    中转都是默认没隐私
    calmbinweijin
        32
    calmbinweijin  
       Mar 11
    @freak118 服务器、域名、搞纯 cc 还得自己搞账号、自己进行二次开发也得消耗 token 、运营送的 token 。对于一个刚起步的中转站真的挺难的
    poorcai
        33
    poorcai  
       Mar 11
    话说 team 账号现在怎么开通啊?官网没看到
    kfpenn
        34
    kfpenn  
       Mar 11
    @lujiaosama 有啊,cursor 的 share data 还不允许取消
    ano
        35
    ano  
       Mar 11
    @lujiaosama 想什么呢,包被拿去训练的,900%。
    区别就是你的数据最终经过了几个人手中,二道贩子,三道贩子,最终还是递给了源头手上。
    timeance
        36
    timeance  
       Mar 11
    幸好我用中转都是翻译黄油
    sommio
        37
    sommio  
       Mar 11
    像 OpenAI 除了 API 和企业版 Codex ,就没明确“不用于训练”的承诺,
    能降低 API 价格和同时增强国产模型的结果也算还可以了(
    penisulaS
        38
    penisulaS  
       Mar 11   ❤️ 1
    我的代码怀疑都是污染大模型的
    nbndco
        39
    nbndco  
       Mar 11
    中转就是默认蒸馏啊,只要不在乎就挺好的
    dko
        40
    dko  
       Mar 11
    拿去训练是好事儿,如果是专门窃取数据的那就麻烦了。
    dockerhub
        41
    dockerhub  
       Mar 11
    擦,我怎么没人找我。我的服务器两天的日志都存不下 😆
    v2exgo
        42
    v2exgo  
    OP
       Mar 11
    @dockerhub 尼玛的,卖数据被抓到要直接进去的,倒卖 api 最多非法经营,
    Meteora626
        43
    Meteora626  
       Mar 11
    @lujiaosama 会随机抽,但是大厂训练会脱敏的,大厂的数据处理还是很完善的,
    catazshadow
        44
    catazshadow  
       Mar 11 via Android   ❤️ 3
    岂止训练,起手就是 grep 'pwd|pubkey|cred' 🤣
    isnullstring
        45
    isnullstring  
       Mar 11
    用谁都一样,中转卖、官方的自己用
    rfv2
        46
    rfv2  
       Mar 11 via Android
    官方为什么不加类似 https 的内容加密,在推理前解密,很好的卖点。虽然基本上都不允许大家中转
    unusualcat
        47
    unusualcat  
       Mar 11
    1USDT 50 条会话?这玩意这么值钱啊!
    v2exgo
        48
    v2exgo  
    OP
       Mar 11
    @unusualcat 要那种单次对话的
    aarontian
        49
    aarontian  
       Mar 11
    能用中转的都不会是啥好的训练数据吧。。。真正有价值的训练数据都直接通过正规渠道给 claude 了
    goodboy95
        50
    goodboy95  
       Mar 11 via Android
    我连用官方的都默认数据全交出去了
    ideard
        51
    ideard  
       Mar 11
    还好我是自建,免费的东西代价太大了
    JoshTheLegend
        52
    JoshTheLegend  
       Mar 12
    别说中转了,用官方的不都是默认全交的吗...
    unixcs
        53
    unixcs  
       Mar 12 via Android
    比起我的数据,我更想省点 token 的钱
    unusualcat
        54
    unusualcat  
       Mar 12
    没事别用中转。用户在多轮对话中(比如发代码报错日志、写工作总结、甚至倾诉心理问题)极容易泄露公司机密、个人隐私或真实身份。一旦这些数据被原封不动地喂给新的大模型,新模型在未来回答别人问题时,极有可能把你的隐私直接背诵出来
    v2exgo
        55
    v2exgo  
    OP
       Mar 12
    @unusualcat #54 这个我倒不担心,如果模型能力差到这种地步,连数据清洗都不做,这个 LLM 公司离倒闭也差不多了,我担心的是 利用私钥、机密信息犯罪,卖数据如果涉及到这些就直接进去了
    LowBi
        56
    LowBi  
       Mar 12
    官方交,用 cursor 、trae 这些也交,中转也交,焦虑啥啊这是,除非你搭建本地的模型,而且是超越了这些大厂的模型,不然你就啥线上模型都不要用了,从你使用的那一刻,你的对话肯定会到对方服务器上的。
    MoozLee
        57
    MoozLee  
       Mar 12   ❤️ 1
    我的破代码被拿去蒸馏了,我有什么损失吗?
    dabingbing
        58
    dabingbing  
       Mar 12
    在乎这个?
    viking602
        59
    viking602  
       Mar 12
    @freak118 #4 中转站本身就不是什么正经营生 爱用就用的那种基本上
    beijiaoff
        60
    beijiaoff  
       Mar 12
    @rfv2 我觉得从技术上完全可以。就是中转本身就是灰色的……
    luckywuuuuu
        61
    luckywuuuuu  
       Mar 12
    @sommio 有的,gpt 网页版可以设置不用于模型训练。但是,这种东西只有大企业说的你还可以信一点。。。
    ps: 其实正常人和公司不怕主流的大模型学习到了,因为激活这个信息的概率太低了,怕就怕别人不拿来训练拿来扒提示词
    toriagpiosk
        62
    toriagpiosk  
       Mar 12
    前端时间就发现了,大量灰产组织开始和——AI API 中转站出现交易,其中很多都是公益站

    <img src="https://tc.7zz.cn/i/2026/03/12/35c2a3d28a994684387b7f7b6df35934.png" alt="image" />
    chi1st
        63
    chi1st  
       Mar 12
    官方就不用你数据了?你在 V 站的发言也早就被拿去训练了。。。
    nVic
        64
    nVic  
       Mar 12
    @chi1st 一般来说你不会选择在 v 站发自己的敏感信息
    zomco
        65
    zomco  
       Mar 12
    他不会以为我用中转站是干正经事的吧
    jiangzm
        66
    jiangzm  
       Mar 12
    做中转站的真恶心
    streamrx
        67
    streamrx  
       Mar 12 via iPhone
    用中转站不就是默认数据 100%会被使用和出售吗
    click04
        68
    click04  
       Mar 12
    理论上中转站确实具有很高的超级权限:
    1. 看到所有用户输入的信息
    2. 编码/养虾场景可以在大模型响应中加上额外的任意命令
    相当于把远程操作能力交给了一个没那么可信的组织。
    有很多公益免费的站点不知道他们热衷建站的目的,为了技术平权?
    boboboka
        69
    boboboka  
       Mar 12
    不知道是不是公益站会出现,我现在用的几个付费中转,倒是都说不会保存,也不知道是不是真的
    635925926
        70
    635925926  
       Mar 12   ❤️ 1
    问题来了,能不能反向污染呢。比如搞一个项目的变量名全是拼音。
    eya46
        71
    eya46  
       Mar 12
    官方的也一样,买的豆包 coding plan 明确写着可用于训练😒
    evamayy
        72
    evamayy  
       Mar 12
    免费的才是最贵的,你以为你在用便宜的 API ,其实你自己才是产品
    nyfwan123
        73
    nyfwan123  
       Mar 12
    我是做中转的 确实有人找我买过 但是我硬盘就 40 个 G 还有自己的数据 且都是老朋友在用 所以拒绝了采购
    v2exgo
        74
    v2exgo  
    OP
       Mar 12
    @click04 一些是用爱发电吧
    XiaoBu1
        75
    XiaoBu1  
       Mar 13
    只要是中转,中间人一定能看到明文吧
    v2exgo
        76
    v2exgo  
    OP
       Mar 13
    @XiaoBu1 是的,所以要把秘钥、跟私钥保存好,不让 agent 去读取,代码倒是没啥问题,很多时候就是碎片,这些人买数据,绝对不是为了训练,训练只是一个幌子而已
    street000
        77
    street000  
       Mar 13 via Android
    50 对话 1u ?急需联系这个人
    genesisx
        78
    genesisx  
       Apr 8
    反正也是用 ai 写的代码。。。不值钱
    genesisx
        79
    genesisx  
       Apr 8
    @street000 是 50 次 session ,不是 50 次对话,一次 session 一般要求对话十几轮
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   4579 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 257ms · UTC 04:10 · PVG 12:10 · LAX 21:10 · JFK 00:10
    ♥ Do have faith in what you're doing.