我先来抛砖引玉。我这笔最大支出可能听起来有点偏门——大疆麦克风 dji mini ( 500 左右)。

虽然它是个收音设备,但在现在的 AI 时代,简直是生产力外挂。现在的语音识别准确率太恐怖了,我把它配合微信的全局语音输入,日常基本已经彻底告别手敲键盘。
我知道大家可能觉得办公室讲话打字很奇怪,但是这个是领夹麦,讲悄悄话都能识别出来,我做了两年多 ASR 接入,对于麦克风还是有点研究的,识别效果差基本上是因为声源太远或者有噪音。
最爽的是配合 Vibe Coding 。以前遇到问题,用键盘打字描述很容易卡壳,甚至打着打着就丢失了上下文的逻辑。但现在直接用嘴输出,语音能把脑子里的想法非常顺滑地串联起来,遇到什么问题就直接“说”掉,思路完全不会被打断。
不知道大家的“最大支出”是订阅了各种 API 、买了算力显卡,大家可以交流借鉴一下
1
sillydaddy 10 天前
之前看 v 友的分享,买了 DJI Mic Mini ( 150 块钱左右),初测效果不错,后面不知道为啥不行了,就退货了。距离稍远些就识别不出来,或者环境稍嘈杂,而相同距离相同环境下,MacBook 自身的拾音效果还能保持不错。
|
2
LucasMartine 10 天前
花了 1.4w 买了这个域名 https://sendflare.com 不过我这个不算 AI 时代,但是算我整个出海的过程中, 花费最贵的一笔
|
3
VitaminC1989 10 天前
花 200 大洋买了域名 https://vibe-coding.to/
|
4
NeonMike 10 天前
打字输出的过程,包含思考的过程
直接语音输出,会有问题的 |
5
lifei6671 10 天前
每月 20 刀订阅了 plus 。
|
6
cairnechen 10 天前 我用 yyf 淘宝店的镇店之宝 SM-008 未尝不能与你一战
|
7
wu67 10 天前
100 刀包了 copilot 一年
|
8
iorilu 10 天前
我买了个绿联台式麦克风, 感觉不错
usb 的插上就用 |
9
redoccheng 10 天前
请问在办公室,有同事发表讲话,会影响识别怎么办?有这种支持音色锁定的 mic 吗?
|
10
cvbnt 10 天前
openrouter 充了 10 刀
|
11
PerFectTime 10 天前
之前风控不严的时候买了 cc 20x
|
12
qazwsxkevin 10 天前
真巧,我刚想找一个带 PTT 按钮,又能无线蓝牙连接的麦克风,真找不到。。。
|
13
andforce 10 天前 via iPhone
陆陆续续,买了大约 1000 刀 Cursor 会员,疯狂撸私活
|
14
tigerZhang 10 天前
中英文混合输入时,语音识别的准确度如何?
|
15
samzong 10 天前
应该就是自费 token 打工人来
|
16
hoky 10 天前
楼主那个充电盒有必要吗?我买了这个 1 拖 1 ,没有要充电盒。359 元。
|
17
vowers 10 天前
每月 100$的订阅
|
18
Gilfoyle26 10 天前
最大的支出就是 chatget 了,每个月 20 美金
|
19
qwwuyu 10 天前
google pro 99$
|
20
f165af34d4830eeb 10 天前
飞到美国开了个 checking 账户和信用卡
|
21
importmeta 10 天前 买 AI 股票。
|
22
dobelee 10 天前 via iPhone mbp 3w 。三年各种订阅数万。
|
23
hellodigua 10 天前
这个拼多多二手的一百多,但是是 dji mic mini ,不知道是否一样
|
24
iorilu 10 天前
@hellodigua 不一样的, 这个一拖二的
|
25
gigishy 9 天前 via iPhone
最大的支出还在等待中……
想买 512g ram 的 M5 max 以上 Mac ,暂时没有卖的…… |
26
xshell 9 天前
token
|
27
yokon 9 天前
glm coding plan
|
28
CoderGeek 9 天前
自己 nuc 的电费 - -
|
29
312ybj OP @redoccheng 领夹麦的拾音范围本来就小,挂在领口,别人声音再大也收不进去,所以基本没影响。另外,‘音色锁定’应该是‘说话人识别’。这个功能是在 ASR 之后进行的,属于后置算法计算。现在成熟的方案,都是靠后置提取声音特征来区分具体是谁在说话的,我现在用的是微信自带的全局语音输入,没有这个功能
|
30
312ybj OP @qazwsxkevin 我这边有一个科大讯飞的鼠标,它有 ASR 功能,也有 PPT 功能,上下翻页,甚至还有激光灯功能。但是不好的一点就是你讲话,你不可能把鼠标放在嘴巴讲话,怪怪的,我就不怎么用了
|
31
312ybj OP @tigerZhang 我用的就是微信自带的全局语音输入,微信的识别怎么样,它就怎么样
|
33
312ybj OP @gigishy 我之前买过一台 32G 的 M2 max,不过后来卖了,单个小模型的推理速度的话,其实还行,跟 4090 差的不是那么多,但是生图生视频就差很多, 我这边还有一台 amd 395 128G 的小主机,但是带宽不够,推理速度还是慢
|
34
frank1256 9 天前
给 nas 升级了 2 手电源 500,加一块酷狼 4t ,800.
之前给龙虾玩 gemini api ,超了赠金,花费 50hk 。 模型白嫖的一年学生 Google pro ,openai 闲鱼上的 team2 天挂了退款了,现在薅的 plus 月卡。目前花费 0 元。 |
35
CherryGods PRO 给公司所有人提供无限量的 codex
|
36
coconutwater 9 天前
@cvbnt #10 同充 10 刀,目前还剩 9.6 刀
。另外闲鱼 geminipro 学生认证花费 20+元 [已封] ,闲鱼 9.9 元 openai team 账号一个月 |
37
kelvinaltajiin 9 天前 via Android
@312ybj 有没有 Windows 下除了微信的语音输入方案,很多外部软件公司不让装。。。
|
38
goodboy95 9 天前 via Android
1900 ,一张 2080ti
|
39
312ybj OP @kelvinaltajiin 我试了智谱的语音输入法,半天没找到使用入口;搜狗的输入法,广告太多;后来发现微信自带全局语音输入,就一直用这个, 更多-设置-快捷键-控制范围(调整为全局即可),然后就可以 ctrl+win 进行语音输入了
|