V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
cdredfox

用 AI 搓了一个语音输入法 sayany,支持豆包在线/离线模型, Vibe Coding 效率翻倍

  •  
  •   cdredfox ·
    cdredfox · 2 天前 · 363 次点击

    最近在 Vibe Coding 的时候,发现一边写代码一边口述需求给 AI 效率非常高,但市面上的输入法要么隐私有顾虑,要么离线识别率感人。

    索性自己动手搓了一个 sayany ,这段时间我自己一直在用,体验还不错,特地来 V2EX 和大家分享一下

    🤔 为什么要造这个轮子?

    主要是为了解决两个痛点:

    • 隐私安全:不想把剪贴板和语音数据都上传给大厂。
    • 识别准确率:纯离线模型虽然安全,但有时候“智障”起来也很头疼。

    🛠️ 核心特性

    这个项目最大的特点就是灵活,兼顾了隐私和准确率: 双模型支持:

    • 离线模式:下载约 150M 的模型后,完全断网也能用,保护隐私。
    • 在线模式:集成了豆包( Doubao )的在线模型。亲测豆包的识别率非常顶,特别是中英文混输、带口音的普通话,处理得非常干净,而且价格很便宜。
    • 智能优化:支持语音识别后的智能标点补充和文本润色。
    • 智能助手:不仅仅是输入,还能作为 AI 助手进行对话。

    💡 使用建议

    如果你是在公司内网或者对隐私极其敏感的场景(比如写核心代码、回消息),建议开启离线模式;

    如果是日常聊天、写文档,强烈建议开启豆包在线模型,那个准确率和响应速度会让你打开新世界的大门。

    在线体验/下载: https://sayany.miyun.tech

    以上官网,应用都是通过 AI Vibe Coding 出来的。

    yukminnie
        1
    yukminnie  
       2 天前
    每天都有新的输入法、剪贴板和截图软件可以用(

    反馈一下,软件体验下来很流畅,本地和在线都正常。但有两个问题。第一是使用的是 SenseVoice Small 的小模型,但是后台内存占用达到了 1G 多,不知道为什么。

    第二个问题就是,点击这个快捷键以后,好像大概 1 秒,这个识别的弹窗才开始出现。但实际上已经及时识别,没有吞字,不知道是不是个例。
    cdredfox
        2
    cdredfox  
    OP
       17 小时 6 分钟前
    @yukminnie 谢谢反馈,目前本地模型用的是非量化模型,使用后会常驻内存,所以内存占用会略高,但量识别率会精确一些,量化模型虽然内存低,但是识别率会有下降,这块我研究一下,看有没有办法保证准确率的情况下,降低占用。

    快捷键这个问题我来优化一下。
    yukminnie
        3
    yukminnie  
       12 小时 17 分钟前
    @cdredfox 感觉 230 兆那个小模型日常体验已经足够。如果配合这个在线大模型修正的话,整体很平衡,可以两个模型都下载,然后自行切换。♥️
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   888 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 20:29 · PVG 04:29 · LAX 13:29 · JFK 16:29
    ♥ Do have faith in what you're doing.