豆包的语音对话做的真好, 但是 AI 很一般

2025 年 3 月 31 日
 dreamkuo

有语音对话做得好, AI 水平又高的么, 我指的是 app

3542 次点击
所在节点    问与答
19 条回复
NewYear
2025 年 3 月 31 日
语音对话为了快速反应( 0.x 秒),所用的模型是简化型的,表现出来就是很傻,要按照它的逻辑来才会提高体验,但肯定不好用。

正确用法是“语音消息”,说一大堆话,它会自己梳理好,再给出答复。
NewYear
2025 年 3 月 31 日
0.x 秒时间。
要完成对用户语音识别,比如这句话是否说完了。
要识别内容(当然也是边说边识别的,但最后这点内容也需要快速识别)
然后是“思考”。
然后是“生成高质量语音”。

可以说还是很有挑战性的。

语音对话方式适合“陪伴、闲聊”,不适合你认真探讨一个事情,本身“语音”也不适合一次性说太多话语。
dreamkuo
2025 年 3 月 31 日
谢谢解答
v2er4241
2025 年 3 月 31 日
豆包确实可以,哄娃、哄老人,我都用它。

噢,对了,还能擦边[狗头]。
apollo007
2025 年 3 月 31 日
我用它用来陪娃玩诗歌接龙
stdout
2025 年 3 月 31 日
豆包的语音识别绝对国内第一,经常用很容易区分。以前是讯飞,现在秒杀讯飞,超越讯飞几个档次了。可以不能买他家的股票。
silentsky
2025 年 3 月 31 日
豆包应该是我目前用过体验最好的 语音方面 其他 APP 多音字有时候还会念错
F281M6Dh8DXpD1g2
2025 年 3 月 31 日
做 ai 的忙着跟 hr 谈恋爱呢,没空干活
wei2629
2025 年 3 月 31 日
我一直想说呢。他的音转文真的 nb , 可以帮我把思考中 发的无意义助词去掉, 名词转换精准。长语音转换,就跟手动打字一样。是我用过独一档的,如果微信的音转文能接入 就好了。
wei2629
2025 年 3 月 31 日
@wei2629 有大佬说说是怎么做到的吗? 还有自用的话,接入渠道是什么?
ccvip
2025 年 3 月 31 日
我不想让孩子看垃圾动画片,就把孩子手机上的短视频 APP 都删除了,只留了洪恩 帮帮识字这种的,担心他无聊,给安装了豆包聊天,没想到,这调皮孩子直接让豆包给他发动画片的链接,把学习软件完全废弃了。
我想把豆包换掉,测试了很多家,一个能打的都没有。
ljspython
2025 年 3 月 31 日
@klo424 #4 细嗦擦边
mingtdlb
2025 年 3 月 31 日
@liprais #8 笑死了,有瓜吗 在线吃瓜
wyntalgeer
2025 年 3 月 31 日
MiniMax
SachinBeyond
2025 年 3 月 31 日
你是在说这个 豆包? https://v2ex.com/t/1115885
huigeer
2025 年 3 月 31 日
deepseek 是不是打碎了豆包的 ai 梦
allendavis
2025 年 3 月 31 日
之前听过一个笑话让用户念代码给他?
v2er4241
2025 年 4 月 1 日
@ljspython 豆包 app 有个叫智能体的东西,可以设定她的角色,虽然设置了擦边的设定会提示审核未通过,但审核需要时间,在这段时间内对话擦边是可以正常回复的(别太明显注意躲避敏感词),等审核不通过的时候再修改一下设定,重新审核的时候还能接着聊。
dreamkuo
2025 年 4 月 3 日
@klo424 细说擦边

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1122150

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX