用 AI 搓了一个语音输入法 sayany，支持豆包在线/离线模型， Vibe Coding 效率翻倍

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

最近在 Vibe Coding 的时候，发现一边写代码一边口述需求给 AI 效率非常高，但市面上的输入法要么隐私有顾虑，要么离线识别率感人。

索性自己动手搓了一个 sayany ，这段时间我自己一直在用，体验还不错，特地来 V2EX 和大家分享一下

🤔 为什么要造这个轮子？

主要是为了解决两个痛点：

隐私安全：不想把剪贴板和语音数据都上传给大厂。
识别准确率：纯离线模型虽然安全，但有时候“智障”起来也很头疼。

🛠️ 核心特性

这个项目最大的特点就是灵活，兼顾了隐私和准确率：双模型支持：

离线模式：下载约 150M 的模型后，完全断网也能用，保护隐私。
在线模式：集成了豆包（ Doubao ）的在线模型。亲测豆包的识别率非常顶，特别是中英文混输、带口音的普通话，处理得非常干净，而且价格很便宜。
智能优化：支持语音识别后的智能标点补充和文本润色。
智能助手：不仅仅是输入，还能作为 AI 助手进行对话。

💡 使用建议

如果你是在公司内网或者对隐私极其敏感的场景（比如写核心代码、回消息），建议开启离线模式；

如果是日常聊天、写文档，强烈建议开启豆包在线模型，那个准确率和响应速度会让你打开新世界的大门。

在线体验/下载： https://sayany.miyun.tech

以上官网，应用都是通过 AI Vibe Coding 出来的。

语音输入法

隐私

效率

3 条回复

yukminnie

2 天前

每天都有新的输入法、剪贴板和截图软件可以用（

反馈一下，软件体验下来很流畅，本地和在线都正常。但有两个问题。第一是使用的是 SenseVoice Small 的小模型，但是后台内存占用达到了 1G 多，不知道为什么。

第二个问题就是，点击这个快捷键以后，好像大概 1 秒，这个识别的弹窗才开始出现。但实际上已经及时识别，没有吞字，不知道是不是个例。

cdredfox

17 小时 6 分钟前

@yukminnie 谢谢反馈，目前本地模型用的是非量化模型，使用后会常驻内存，所以内存占用会略高，但量识别率会精确一些，量化模型虽然内存低，但是识别率会有下降，这块我研究一下，看有没有办法保证准确率的情况下，降低占用。

快捷键这个问题我来优化一下。

yukminnie

12 小时 17 分钟前

@cdredfox 感觉 230 兆那个小模型日常体验已经足够。如果配合这个在线大模型修正的话，整体很平衡，可以两个模型都下载，然后自行切换。♥️