V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jamme
V2EX  ›  Local LLM

请教一个关于模型训练主机配置的问题

  •  
  •   jamme · 3 小时 31 分钟前 · 146 次点击

    主要是用来部署YOLO26做数据集训练和目标检测或追踪的,图片数据暂定 5000 张(其实数据有很多,但是暂定用于训练的数据上限是 5000 张)。

    目前有一台 RX6600xt ,但是 directML 好像也不能使这张卡参与训练计算,上网查了一下好像是对 7000 系列以上的显卡支持的更好一些。

    所以老板的意思是重新配一台 N 卡主机,但我之前没有使用 YOLO 训练的经验,不知道目前这个数量级的数据训练以及这个体量的模型该使用什么卡。咨询官网 AI 的话,就是无脑推荐 4090 、5090 这种大显存的卡。搞得我很头疼~

    关于预算的话,老板只说了一句你看着办吧。但之前老板的意思是让我看看能不能把现在这台主机的显卡换成 RTX5070 ,后来我查了一下现在主机的电源,才 500W ,带不动 5070 ,才有了配新主机的这件事。所以我想着写个两三套配置单给老板看,低配高配都写一下,让老板决定选什么。

    有没有有YOLO 训练+目标检测经验的 V 友给点建议?跪谢了~

    4 条回复    2026-04-26 01:14:45 +08:00
    zhoukevin233
        1
    zhoukevin233  
       1 小时 30 分钟前
    训练模型的话,主要就是看显存。我最近搞的是 YOLO11 ,batch_size 为 4 ,分辨率为 640 的情况下训练也需要 7.5GB 显存。给到你的话,低配 12GB 显存( RTX4070 ),高配自然是 5090 直接拉满,batch_size 开大是有利于模型训练的。
    akuan96
        2
    akuan96  
       1 小时 24 分钟前
    之前用公司的 4090 做 YOLO 训练,千张图基本都是半天左右出结果,有问题还要调整重新训练,所以建议还是搞大显存的,不然会非常折磨,反正又不用你出钱😏
    benz1
        3
    benz1  
       1 小时 22 分钟前
    benz1
        4
    benz1  
       1 小时 18 分钟前
    @benz1 显存和内存都很重要,Batch Size 的大小挺影响训练速度的。 现在自己训练千张的小模型都是使用 3L 的官方平台,整理数据集和模型都挺方便。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1039 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 18:33 · PVG 02:33 · LAX 11:33 · JFK 14:33
    ♥ Do have faith in what you're doing.