[开源] Rust 写了个纯本地的实时语音转录翻译软件

2025 年 2 月 7 日
 leonz95

最近在听英文播客,有时候也挺多废话的,所以弄了个挂在桌面像歌词的实时翻译软件,就可以边打代码边听了。有英文会议也很有用。

开源 GitHub repo,欢迎 star 。当前只支持 macOS ,有需要 windows 的可以提 issue 让我知道。

3219 次点击
所在节点    分享创造
11 条回复
w568w
2025 年 2 月 7 日
不错,感觉是一个很好的 tauri + candle 实践,先 star 一下。

看了下代码,感觉主要 platform-specific 的是音频捕获?可以考虑一下 https://crates.io/crates/cpal


p.s. Windows 有系统级实时字幕,功能上是重合的,不过经常识别不准。
molezznet
2025 年 2 月 7 日
rust 不是天生跨平台 linux mac win
leonz95
2025 年 2 月 7 日
@w568w 嗯嗯,就是音频捕获。 两三天搞的自己用着就先没考虑其他平台。 我这个还得加一下 vad 判断停顿分句效果能更好些。
Tink
2025 年 2 月 7 日
看动漫也能用吧
leonz95
2025 年 2 月 7 日
@Tink 哈哈可以的,但目前只集成了英译中的模型。 日语动漫嘛?
rm0gang0rf
2025 年 2 月 8 日
需要 windows 的请+1
dreasky
2025 年 2 月 8 日
tauri 可以使用 HTML5 的 Web Speech API 跨平台语音识别 本地识别多语种速度快效果还行
Tink
2025 年 2 月 8 日
@leonz95 #5 嗯嗯
aero99
2025 年 2 月 8 日
不错,这个很有用
leonz95
2025 年 2 月 15 日
@rm0gang0rf 已支持 windows
ming1455
3 月 17 日
只能 N 卡才可以用?提示找不到 cudaxxx.dll

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1109747

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX