
去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。
6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
我的场景比较特殊:人在海外开发,中英法混用,一句话里频繁切换语言。这正好是大多数商业方案的痛点。
目前已经完全融入日常工作流,每天触发上百次,用得很顺手。
如果你跟我一样要写英文代码注释、和海外团队对接、刷英文文档、中英混着说话,首选 Soniox。这五个引擎我都跑了几个月,Soniox 是多语种混合识别最稳的一个:
试用期 30 天可以把这几个引擎挨个跑一遍,选最顺手的。
仅支持 Apple Silicon ( M1 及以上)+ macOS 14 Sonoma 及以上
技术栈感兴趣的也欢迎聊:Swift + SwiftUI 、AVAudioEngine 抓音频、WebSocket 流式 STT 、Ed25519 离线 License 验签。
1
okchum 5 days ago 看来 51 放假大家都没兑换啊. 隔了 10 个小时还能兑换了一个. 谢谢楼主啊, 我试试看
|
2
HvangStormstout 5 days ago 有适配 windows 平台的计划吗?😘
|
5
Dream11 5 days ago
佬,在哪里可以输入折扣吗呀
|
8
qfdk OP PRO @HvangStormstout 不好意思,可能让您失望了, 因为没有 windows 设备,而且是用的原生 swift 为了达到更好的流畅体验.搞了快 6 个月了, 大大小小的 bug, macos 平台稳定了.
|
9
lihua 5 days ago
有点没明白,在哪输入折扣码。
|
10
Bssn 5 days ago 感谢 op
|
15
Dream11 5 days ago 感谢佬,是个好项目,很顶
|
16
amnaruto 5 days ago 感谢大佬分享,耍耍
|
17
Dream11 5 days ago 我这边好像有一个 bug ,隔一段时间第一次唤醒的时候,它就一直在聆听,没有实时转换,最后也没有输出文本,但是我看见窗口的音频是有变化的
|
19
teaguexiao 5 days ago 终端友好这个点确实是痛点,用 Cmd+V 贴终端经常丢字或触发自动补全完全跟想要的不一样。想请问一下多语种混识时延迟怎么样,特别是中英文切换的首字延迟?
|
20
qfdk OP PRO @teaguexiao 多语言混输延迟很很靠谱的 我推荐你使用 Soniox 模型。几乎没有延迟,你可以看 demo 的 gif. 场景是中文 + 法语+ 英语.
|
21
qfdk OP PRO @teaguexiao 看老哥也是开发者 做了语音输入,如果需要的话 我可以单独给你一个开发者授权,同行也欢迎一起来改进 :)
我做语音输入本质都是自己一直在使用的 里面会碰到很多各种各样的痛点 比如说切换显示器的时候 麦克风会丢失 切换笔记本 切换耳机 切换蓝牙 各种各样的这样的小问题吧 碰了也是很多产品也一直在打磨. |
22
PaulSamuelson 5 days ago 感谢,大假期间还在逛 V 的朋友有好运。
|
23
Livid MOD PRO |
24
Vnaner 5 days ago 需要 windows +1
|
25
47jm9ozp 5 days ago 快捷键有些复杂,可以参考豆包输入法,双击 alt 或者长按 alt
|
26
47jm9ozp 5 days ago
以及,不知道为什么,在进入 checkout 页面时候,给我显示了保加利亚语……
|
27
47jm9ozp 5 days ago 以及,结束输入之后,状态栏里始终显示 voila 在使用麦克风
|
28
bowencool 5 days ago 逛 V 站这么久了,第一次领到免费的兑换码,谢谢
|
29
qfdk OP PRO |
30
bowencool 5 days ago |
31
dnfQzjPBXtWmML 5 days ago c'est bien merci
|
32
qfdk OP PRO @47jm9ozp #27 首先感谢使用.
快捷键主要使用的都是组合键,避免出现误触,我会下载豆包参考, 因为服务器缘故豆包对海外地区不是很友好. 关于 Checkout 页面出现了保加利亚语,理论上是 checkout 服务器检测到了某些 浏览器头 导致,或者 ip 的问题,这个抱歉无法控制. 使用显示麦克风,是为了快速激活是为了快速进行语音输入,当你按下组合键的时候 理论上已经开始记录了. 再次感谢使用反馈 |
33
qfdk OP PRO @dnfQzjPBXtWmML Avec plaisir ! N’hésite pas si tu as des bugs 😊
|
34
qfdk OP PRO @bowencool #30 感谢反馈,这些引导,说实话没有太好好做,抱歉带来的困扰.
这个问题有 V 友反馈了,这是后面需要优化的地方,一开始是个个人用的产品. 稍后我会发一个特别的授权发给特别的你! |
35
qfdk OP PRO @Vnaner 感谢反馈,记录下了. 因为初衷是 自己用又跟手的输入,没有考虑跨平台.
也是因为没有跨平台,安装包才 8M 左右,到时候出来 windows 版本少不了老哥帮着打磨 |
37
tojonozomi 5 days ago 感谢 op ,最近键盘敲多了,手腕不是很舒服,也在找语音输入法,马上试试
|
38
clockcloud 5 days ago 感谢分享,试试
|
39
notaCoder 5 days ago 和 TypeWhisper 比,有什么独特的地方吗,以前用 Whisper Transcription ,但是后来有的模型要花钱就换着试了好几个,不想再换了
|
42
qfdk OP PRO @notaCoder #41 不好意思我看错了, 以为你说的是 whisper,主要是像我这边做的都是 Soniox, elevenLabs,有 websocket 的加成优化,欧洲很舒服.终端一直在用,配合上靠谱的 API 准确率还是蛮高的,加上我这边有智能分词底层使用 jieba 分词,去掉奇怪的词语.
TypeWhisper 强在本地模型多 + 插件/CLI/批量转写更全,更像工具箱,马克下,看看有没有好的细节借鉴下 :) |
43
pierreoui12 5 days ago 佬兑换码用完了嘛,可惜看见迟了。
Quel dommage que je n'aie rattrapé ça que maintenant ! C‘est un bon logiciel ! |
44
pierreoui12 4 days ago
哎,罢了,还是考虑一下自购一份支持吧
|
45
qfdk OP PRO @pierreoui12 #44 Yo Pierre, tkt ! 私我,给你单独开个授权! 100 份发完了.
|
46
netconf 4 days ago via Android 老哥,求一个兑换码 OTY4ODI4QGdtYWlsLmNvbQ==
|
47
seelight 4 days ago 虽然来晚了一点, 不过大佬的 landpage 做的好 fashion, 即便有 vibe 个人审美也是很好的, 字体和排版都很有让人试用的欲望:)Super, je valide
|
48
mirror 4 days ago 早鸟票忍不住想氪一个
|
49
Lituby 4 days ago via Android 感谢分享,求个码,谢谢
bGl0dXJpYnlAb3V0bG9vay5jb20= |
50
Livid MOD PRO |
51
pierreoui12 4 days ago @qfdk Merci bcp ! Je vous ai envoyé un email sur votre gmail nommé "Voilà App 授权申请 - V2EX pierreoui12",bonne continuation !
|
53
qfdk OP PRO @pierreoui12 #51 Bien reçu et voilà ta licence !
|
56
netconf 4 days ago via Android
感谢大佬
|
59
doubu 4 days ago via iPhone
来晚了,大佬,求一个码,谢谢
NnNwb3QwN0BnbWFpbC5jb20= |
60
Reminders 4 days ago
来晚了,如果可以的话,我也想求个兑换码,打扰了。祝生意兴隆。
eXVoYW8uY29kaW5nQGdtYWlsLmNvbQo= |
61
Reminders 4 days ago
|
62
Emyorii 4 days ago via iPhone
求个码,谢谢,SDBpMEBvdXRsb29rLmNvbQ==
|
63
bigoxEvan 4 days ago
求码;大佬,比较火爆,来晚了,希望给一个码,感谢!
YmlnX294QDE2My5jb20= |
64
cue 4 days ago
|
65
qfdk OP PRO @Reminders #61 使用显示麦克风,是为了快速激活是为了快速进行语音输入,当你按下组合键的时候 理论上已经开始记录了.码子稍后发,有意见也欢迎提出
|
68
Sauryer 4 days ago
类似于 Type4Me https://github.com/joewongjc/type4me ?
|
69
Xhofe 4 days ago
求个码,谢谢,aG9mZXh1QGdtYWlsLmNvbQ==
|
70
qfdk OP PRO @Sauryer 有点类似,但定位不一样。Type4Me 更像开源语音输入平台,强调多模型和可配置; Voilà 更像产品化 Mac 输入工具,重点是开箱即用、稳定实时输入和更少配置。想解决的是普通用户每天把语音当键盘用的问题,以及海外用户的痛点, 国内某些模型不是很友好.
|
71
Reminders 4 days ago
@Sauryer #68 https://yuuone.app 好像有点类似
|
73
aker91 3 days ago 用语音输入有半年多了,但是每个软件都有痛点,试试看你这个
|
75
Bootis 3 days ago 付费成功但是 gmail 没有收到邮件
|
77
0xo 3 days ago
“火山引擎:纯中文最准,但不支持混合识别,碰到英文单词会音译成汉字”
默认配置的语言就是中英混呀,不会音译 |
81
qfdk OP PRO @Bootis #75 再次感谢您的购买意愿,由于没有找到您相应的联系方式, 方便您来主动联系一下 [email protected]
|
82
papa2 3 days ago
mac 自带不是有吗? 跟自带的比好在哪
|
83
qfdk OP PRO @papa2 Voilà 主要是引擎能挑——主力 Soniox ,多语种混说不用切语言,还能传 context 把术语喂进去,识别精度直接上一档。要离线就 Apple Speech 本地,火山/ElevenLabs 也接了:)适合各种场景使用。主要打的就是用起来舒服,现在就是一个每天使用的一个小工具了。
|
86
aker91 3 days ago @qfdk #78 开启和配置了 ai 润色后,实测完全看不出效果,不清楚问题在哪里,去掉语气词的功能对我来说没有意义,因为很多口癖不用 ai 润色是无法解决的
我在口述之后会阅读下生成的内容,结构化的内容可以方便我验证,因为我经常会说挺长的大段的 对我来说目前是不如闪电说的,但闪电说的词典功能经常不生效,不清楚原因,除此以外都挺好 |
87
ceilingyear 3 days ago 支持支持
|
88
qfdk OP PRO @ceilingyear 感谢支持
|
89
qfdk OP PRO @aker91 #86 非常感谢您深入的测试,至于 AI 润色为什么看不出效果,因为我这里做了一个特别的优化,高置信度自动跳过 AI 润色,这样的话会节约 token ,然后更快地把文字展现出来。好的我也去参照一下闪电说.
再次感谢您的建议。 |
90
qfdk OP PRO @aker91 #86 ai 润色现在打开不会做这样的小优化了, 并且优化了下提示词,并推送了新版本 1.1.4, 您要有使用的话可以还原默认提示词. 如果方便的话,您可以把你常说的那种大段给我我参考下,来解决一下痛点。
|
91
evi1ox 2 days ago via iPhone
大佬求个码 [email protected]
|
92
EdwardKot 2 days ago 目前在用 lazytype ,总体体验良好,但是偶尔会遭遇没在用的时候 cpu 涨很多的情况,试试你的
|
93
qfdk OP PRO @EdwardKot 感谢支持,年初有在用 LazyType,发现了很多自己碰到的 bug, 后来弃坑了. 有问题欢迎留言,晚些 v1.1.5 版本会出一个新模式 也是之前想做还没有发的 :)
|
96
panghu960 1 day ago 语音输入能不能留下来,我一般看它是不是能少打断当前工作流。比如在编辑器、浏览器、聊天窗口里不用切太多状态,识别错了也能很快改。如果每次都要想“我要怎么启动它”,最后就会变成偶尔尝鲜。
|
97
mylxsw 1 day ago 自荐一下,我最近刚发布了一款 macOS 的开源语音输入法 Typeflux ,想做 macOS 上最接近 Typeless 的开源替代品,欢迎朋友试用和给意见 🙏
- Github: https://github.com/mylxsw/typeflux - 官网: https://typeflux.app  |
98
qfdk OP PRO @panghu960 是的,是的,您说得没错,还有第一次输入的体验。比如说,我也之前在想过如何能更快地让它更准确地识别,像你说的识错,识别错了也能很快地改。我在想之前老罗还在锤子的时候,有一个大爆炸的功能,我觉得这个可能挺好,暂时还没有想好怎么能把它实现得更好一些吧。
现在设计的时候也做了一些分词的功能,就是一些小巧思嘛,比如说我爱北京天安门。可以分割成我爱北京、天安门,或者是我爱北京天安门。或者是我爱北京,天安门。 欢迎体验 :) |
99
qfdk OP PRO @mylxsw 感谢你的推荐。我已经把你 APP 也下载出来了。说实话,您的 UI 确实比较好看,但是,在功能上我觉着还是我这个会更胜一筹吧。
因为第一次体验的时候,就直接出现了处理失败。但是通过后台去查看的话,它确实是识别到语音了。因为你的 AI 转写理论上应该要把它关闭才可以,因为第一次你有一个跳过配置 token 的环节,理论上不配置 token 的话也不应该影响使用才对。 如果有需要可以单独联系我,我给你一个开发者授权。 ![]() ![]() |
100
mylxsw 1 day ago
|