做了个离线 iPhone 同传 App,想听听这个场景是否成立

1 天前
 panghu960
大家好,我最近做了一个 iPhone App ,叫 NonetPlay 。

它做的事情比较窄:实时语音翻译,但尽量完全在手机本地跑。

起因是我自己有过几次很尴尬的场景:人在路上、地铁里、飞机上,或者网络很差的时候,想用语音翻译,但常见工具要么需要联网,要么离线模式只适合打字翻译,不适合持续对话。

所以我想试一个方向:

如果把语音识别和翻译模型都放到 iPhone 上,能不能做到“够用”的实时沟通?

现在 NonetPlay 的核心能力是:

- 语音识别在本地跑
- 翻译模型在本地跑
- 不需要账号
- 不需要把语音传到服务器
- 下载模型后可以在飞行模式下使用

当前版本也有明显边界:

- 不是为了替代 DeepL / Google 这种高质量云端翻译
- 模型体积比较大,第一次下载需要耐心
- 离线模型的表达质量肯定不如云端大模型
- 更适合“先能沟通”,不适合严肃法律 / 医疗文本翻译

App Store:
https://apps.apple.com/us/app/nonetplay-ai-interpreter/id6761640051

我现在最想问 V 友两个问题:

1. 你们有没有真实遇到过“需要语音翻译,但网络或隐私不允许上传音频”的场景?
2. 如果离线翻译质量只能做到“沟通够用”,你们会接受吗,还是宁愿继续用云端工具?

如果有人对 iPhone 端侧模型、模型下载、延迟或电量有兴趣,我也可以展开讲一些实现取舍。

App Store 页面截图:
593 次点击
所在节点    分享创造
4 条回复
JoeJoeJoe
1 天前
我感觉产品上不用非得限制死离线?

网络状况好的情况下,可以用云端模型来实现,离线场景可以作为卖点或者特性来设计?

看到了这个,带入场景,脑子弹出来的想法,仅供参考.

ps:如果要分享独立开发经验的话,欢迎来 /go/isv 节点分享
panghu960
19 小时 24 分钟前
这个建议很有价值。

我一开始把“离线”放得比较硬,是想先把弱网、隐私、音频不出设备这几个边界跑清楚。但从产品形态上看,你说的混合模式更现实:网络好的时候可以走质量更强的云端,离线作为隐私模式 / 弱网兜底。

我后面会把这个方向单独评估一下。isv 节点也记下了,如果后面写独立开发过程复盘,会放到更合适的节点里。
kuse2001
18 小时 58 分钟前
在线的就需要点成本了

另外刚看到一个
https://mp.weixin.qq.com/s/R7jRMttQJHoPnh0SZg1IVg
whiteleopard520
18 小时 11 分钟前
能求个码,谢谢了 MjYxOTgxNzU3QHFxLmNvbQ==

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1211006

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX