V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
爱意满满的作品展示区。
qfdk
26.34D
0.16D

五一假期写代码不想打字? Mac 语音输入工具 Voilà,送 20 个免费授权

  •  
  •   qfdk ·
    PRO
    ·
    qfdk · 6 days ago · 4528 views

    Demo

    为什么做这个

    去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。

    6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。

    我的场景比较特殊:人在海外开发,中英法混用,一句话里频繁切换语言。这正好是大多数商业方案的痛点。

    目前已经完全融入日常工作流,每天触发上百次,用得很顺手。

    几个比较用心的点

    • 多引擎可选:Soniox / ElevenLabs / 火山引擎 / Groq Whisper / Apple Speech ,按需切换
    • 实时字幕浮窗:说话时能看到识别中的文字流,不用等结果出来才知道说错了
    • AI 自动润色:去口水词、补标点、修口误,置信度高时自动跳过润色省 200ms 延迟
    • 终端友好:Ghostty / iTerm2 / Kitty 通过 Accessibility API 直接走菜单粘贴,不会被 Cmd+V 事件丢字
    • 自定义词汇表:人名、专业术语强制替换,不会再把 "Soniox" 识别成 "骚扰客死"
    • 隐私:本地优先,云端 STT 直连官方 API ,不经过我自己的服务器

    引擎怎么选

    如果你跟我一样要写英文代码注释、和海外团队对接、刷英文文档、中英混着说话,首选 Soniox。这五个引擎我都跑了几个月,Soniox 是多语种混合识别最稳的一个:

    • Soniox:中英法日西自动切换,无需指定语种,首字延迟 ~1 秒,海外开发者 / 中英混说场景强推
    • 火山引擎:纯中文最准,但不支持混合识别,碰到英文单词会音译成汉字
    • Groq Whisper:英文最强,但是 HTTP 批量识别不是流式,延迟高
    • ElevenLabs:英文流式好,中文一般
    • Apple Speech:完全本地,隐私最好,但中英混说会跳错语种

    试用期 30 天可以把这几个引擎挨个跑一遍,选最顺手的。

    仅支持 Apple Silicon ( M1 及以上)+ macOS 14 Sonoma 及以上

    PS

    • 不订阅、不联网激活、License 文件离线验证
    • 当然了,还有隐藏授权,比如说你想专门体验的老哥也可以信箱私,主要交个朋友.
    • 20 个免费早鸟授权,先到先得,结账时输入折扣码 VOILAV2EX,价格直接归零
    • 官网: https://voilapro.app

    技术栈感兴趣的也欢迎聊:Swift + SwiftUI 、AVAudioEngine 抓音频、WebSocket 流式 STT 、Ed25519 离线 License 验签。

    Supplement 1  ·  4 days ago
    V 友们太热情了,原本 20 份授权已经发到 100 份 😄

    这波也测出不少 bug ,感谢大家反馈!目前免费授权为 1 个月试用期,之后仍可继续使用(仅限支持离线的苹果模型,无烦人弹窗);其他 provider 为在线模型,有更高需求可自行购买~

    欢迎继续试用、提问题;优质反馈我会送特殊授权 👍

    大家玩得开心最重要!今天有些高产,有些朋友会被提出更新, 这是今天一轮的打磨欢,迎更新下载最新版本.
    Supplement 2  ·  4 days ago
    最近有不少朋友来问授权码,这边也统一说明一下:
    之前的免费授权(早鸟福利)其实已经发完了 🙏

    当然,如果确实有需要,也不用太拘谨,可以单独发邮件和我说一声。
    我这边更看重大家的诚意和实际使用场景,能帮到的还是会尽量支持的 :)

    最早是计划发 20 个,后来陆续加到了 100 个,其实已经超出预期了,而且也有一些朋友领了不止一个… 授权可能就会酌情清理了。如果对早鸟版本感兴趣,也欢迎直接购买支持一下~

    Voilà, c'est tout.
    108 replies    2026-05-08 16:43:52 +08:00
    1  2  
    qfdk
        101
    qfdk  
    OP
    PRO
       1 day ago
    @mylxsw #100 可以给 [email protected] 写一封邮件. 不少 V 友的主动联系私人邮件,我都会认真回复的, 开发者授权,特殊授权,都是我会手动发放的 :)

    分享一下,当用户留信箱,等主动发去授权的,大多数没有激活. 我更希望是授权会发给有需要的朋友.
    qfdk
        102
    qfdk  
    OP
    PRO
       1 day ago
    @mylxsw #100 已发
    EdwardKot
        103
    EdwardKot  
       1 day ago   ❤️ 1
    @qfdk #95 今天试用了一下有 2 个问题想问,1 ,快捷键似乎无法绑定我外接键盘的“end”键,因为之前 lazytyper 绑在这个键上,习惯了,但是发现 voila 录不进这个键(其他一些 home 啥的也录不进,但是确实 cmd+字母键是可以)。2 ,我先尝试了“apple 语音”,无论说这么话,都只能识别一个“you”,不知道是不是我哪里设置的不对?其次我用 Groq ,无论说什么,都是“请不吝点赞 订阅 转发 打赏支持明镜与点点栏目”,其他的 api 还没去搞,但是这两个的尝试让我现在还没用上,哈哈
    qfdk
        104
    qfdk  
    OP
    PRO
       1 day ago
    @EdwardKot 感谢您认真测试!

    1. 是这样的,因为 voila 的设计是组合键,单独按键理论上也是不会录入的.主要目的是为了让你知道我在按下这两个组合键的时候,我就应该对我说出的话负责。跟核弹发射一样,不只是一个按钮,需要两把钥匙。

    2. 这个问题我搜索了一下,这个出在 Groq 后面用的 Whisper 的 API 的问题。这个属于说语音 provider 的一个问题。

    https://github.com/openai/whisper/discussions/2645
    https://github.com/openai/whisper/discussions/1783

    3. 苹果语音只能识别一个 you ? 您方便提供一下系统截图吗 因为苹果语音使用的底层 API 是跟你的系统语言有所绑定,或者是要指定语言。它分为 macOS 26 的引擎,还有经典引擎。经典引擎是 macOS 26 之外的离线引擎。

    耽误您的时间了,本人主力使用 Soniox 。

    再次感谢反馈!
    EdwardKot
        105
    EdwardKot  
       1 day ago
    @qfdk #104
    1 ,收到。
    2 ,但是我用 lazy 那个也是 Groq 的 api ,模型选择也是一样,回复这条消息的时候也能正常识别,就很奇怪,之后我又试了把 lazy 用的那个 api 放进来试了之后问题也没有解决,很奇怪。
    3 ,系统截图需要提供哪个部分的?我看了我的地区和语言都是中国大陆。试这个的原因是,我想着没网的时候也不影响使用,顺便看看效果,之前不知道还有 Apple 语音,只用过 Qwen3-ASR 。

    厚颜无耻也先求个码,问题解决后,我对比一下效果选择留一个工具( Z2VzaGVuZmVuZzFAZ21haWwuY29t )
    qfdk
        106
    qfdk  
    OP
    PRO
       1 day ago
    @EdwardKot #105 yo, 邮件联系您了.
    mirror
        107
    mirror  
       11h 39m ago   ❤️ 1
    @qfdk #57 已氪
    qfdk
        108
    qfdk  
    OP
    PRO
       11h 23m ago
    @mirror 非常感谢您的支持! 任何需求,有求必应, voilà~
    1  2  
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   967 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 393ms · UTC 20:07 · PVG 04:07 · LAX 13:07 · JFK 16:07
    ♥ Do have faith in what you're doing.