V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
iX8NEGGn

起飞咯, Meta 发布代码助手模型

  •  
  •   iX8NEGGn · Aug 25, 2023 via iPhone · 3211 views
    This topic created in 976 days ago, the information mentioned may be changed or developed.
    介绍说比 GPT 3.5 还强,程序员可以代码助手自由了?
    地址: http://github.com/facebookresearch/codellama
    13 replies    2023-08-26 14:04:01 +08:00
    yitdlxl
        1
    yitdlxl  
       Aug 25, 2023
    总的来说,在 A100- 80 GB ( TDP 为 350- 400 W )的硬件上训练所有 9 个 Code Llama 模型需要 400 K GPU 小时的计算。估计总排放量为 65.3 吨二氧化碳当量
    murmur
        2
    murmur  
       Aug 25, 2023   ❤️ 4
    @yitdlxl 魔怔了?总比挖矿好吧,AI 模型还能造福人类,挖矿除了扰乱经济秩序还有为犯罪提供渠道还能干嘛
    mxmbfa
        3
    mxmbfa  
       Aug 25, 2023 via Android
    现在有好多水平和 3.5 相当的 ai 好开心
    westlinkin
        4
    westlinkin  
       Aug 25, 2023
    好像不能在 m1 上跑
    vvvVictoria
        5
    vvvVictoria  
       Aug 25, 2023
    Code Llama: our base models designed for general code synthesis and understanding
    Code Llama - Python: designed specifically for Python
    Code Llama - Instruct: for instruction following and safer deployment

    Code Llama - Instruct 主要侧重点是啥,没看明白英文,英文渣,侧重于运维部署?
    iX8NEGGn
        6
    iX8NEGGn  
    OP
       Aug 25, 2023 via iPhone
    @janwarlen 一个针对所有代码,一个针对 python 代码,一个针对自然语言指令
    cryptogems
        7
    cryptogems  
       Aug 25, 2023
    意思是更符合人的直觉,类似对话的模式,前面两个差一些
    superares
        8
    superares  
       Aug 25, 2023 via iPhone
    @janwarlen 前两个是代码提示,第三个是代码生成
    yitdlxl
        9
    yitdlxl  
       Aug 25, 2023
    @murmur 你是不是没脑子,这是官方文档的。另外我要表明的是谁家电脑跑得起来啊?
    superares
        10
    superares  
       Aug 26, 2023 via iPhone
    @yitdlxl 你发的那个是训练用,直接跑模型要求没那么高
    murmur
        11
    murmur  
       Aug 26, 2023
    @yitdlxl 但是我在首页、license 、policy 里都没找到,另外 v2 鼓励直接放原文链接
    FlashEcho
        12
    FlashEcho  
       Aug 26, 2023
    @yitdlxl
    训练和推理不一样。。。人家是说这个模型花了多少资源训练,你推理只需要很少的资源
    就像造一辆汽车需要占地几万亩的工厂,投资几十亿的产业链,但是你需要花几十万,就能买一辆车回去开
    DIMOJANG
        13
    DIMOJANG  
       Aug 26, 2023
    实测 M2 丐版 mba 几乎跑不动,可以生成结果但是生成的过程会让电脑几乎完全卡住🤣

    用的是这个开源项目 https://github.com/jmorganca/ollama
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5792 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 92ms · UTC 07:19 · PVG 15:19 · LAX 00:19 · JFK 03:19
    ♥ Do have faith in what you're doing.