
去年迷上了 Claude Code ,但每次都要打字描述需求,有点累。市面上的语音输入工具试了一圈:要么贵、要么单语种、要么不支持润色,甚至粘贴到终端还会丢字。
6 个月前干脆自己做了一个,专注 macOS 语音输入。界面不花哨,但够实用,有需要可以试试。
我的场景比较特殊:人在海外开发,中英法混用,一句话里频繁切换语言。这正好是大多数商业方案的痛点。
目前已经完全融入日常工作流,每天触发上百次,用得很顺手。
如果你跟我一样要写英文代码注释、和海外团队对接、刷英文文档、中英混着说话,首选 Soniox。这五个引擎我都跑了几个月,Soniox 是多语种混合识别最稳的一个:
试用期 30 天可以把这几个引擎挨个跑一遍,选最顺手的。
仅支持 Apple Silicon ( M1 及以上)+ macOS 14 Sonoma 及以上
技术栈感兴趣的也欢迎聊:Swift + SwiftUI 、AVAudioEngine 抓音频、WebSocket 流式 STT 、Ed25519 离线 License 验签。
1
okchum 1 day ago 看来 51 放假大家都没兑换啊. 隔了 10 个小时还能兑换了一个. 谢谢楼主啊, 我试试看
|
2
HvangStormstout 1 day ago 有适配 windows 平台的计划吗?😘
|
5
Dream11 23h 22m ago
佬,在哪里可以输入折扣吗呀
|
8
qfdk OP PRO @HvangStormstout 不好意思,可能让您失望了, 因为没有 windows 设备,而且是用的原生 swift 为了达到更好的流畅体验.搞了快 6 个月了, 大大小小的 bug, macos 平台稳定了.
|
9
lihua 23h 12m ago
有点没明白,在哪输入折扣码。
|
10
Bssn 23h 11m ago 感谢 op
|
15
Dream11 23h 4m ago 感谢佬,是个好项目,很顶
|
16
amnaruto 22h 59m ago 感谢大佬分享,耍耍
|
17
Dream11 22h 40m ago 我这边好像有一个 bug ,隔一段时间第一次唤醒的时候,它就一直在聆听,没有实时转换,最后也没有输出文本,但是我看见窗口的音频是有变化的
|
19
teaguexiao 22h 23m ago 终端友好这个点确实是痛点,用 Cmd+V 贴终端经常丢字或触发自动补全完全跟想要的不一样。想请问一下多语种混识时延迟怎么样,特别是中英文切换的首字延迟?
|
20
qfdk OP PRO @teaguexiao 多语言混输延迟很很靠谱的 我推荐你使用 Soniox 模型。几乎没有延迟,你可以看 demo 的 gif. 场景是中文 + 法语+ 英语.
|
21
qfdk OP PRO @teaguexiao 看老哥也是开发者 做了语音输入,如果需要的话 我可以单独给你一个开发者授权,同行也欢迎一起来改进 :)
我做语音输入本质都是自己一直在使用的 里面会碰到很多各种各样的痛点 比如说切换显示器的时候 麦克风会丢失 切换笔记本 切换耳机 切换蓝牙 各种各样的这样的小问题吧 碰了也是很多产品也一直在打磨. |
22
PaulSamuelson 21h 39m ago 感谢,大假期间还在逛 V 的朋友有好运。
|
23
Livid MOD PRO |
24
Vnaner 20h 36m ago 需要 windows +1
|
25
47jm9ozp 19h 30m ago 快捷键有些复杂,可以参考豆包输入法,双击 alt 或者长按 alt
|
26
47jm9ozp 19h 26m ago
以及,不知道为什么,在进入 checkout 页面时候,给我显示了保加利亚语……
|
27
47jm9ozp 19h 15m ago 以及,结束输入之后,状态栏里始终显示 voila 在使用麦克风
|
28
bowencool 18h 58m ago 逛 V 站这么久了,第一次领到免费的兑换码,谢谢
|
29
qfdk OP PRO |
30
bowencool 18h 43m ago |
31
dnfQzjPBXtWmML 18h 41m ago c'est bien merci
|
32
qfdk OP PRO @47jm9ozp #27 首先感谢使用.
快捷键主要使用的都是组合键,避免出现误触,我会下载豆包参考, 因为服务器缘故豆包对海外地区不是很友好. 关于 Checkout 页面出现了保加利亚语,理论上是 checkout 服务器检测到了某些 浏览器头 导致,或者 ip 的问题,这个抱歉无法控制. 使用显示麦克风,是为了快速激活是为了快速进行语音输入,当你按下组合键的时候 理论上已经开始记录了. 再次感谢使用反馈 |
33
qfdk OP PRO @dnfQzjPBXtWmML Avec plaisir ! N’hésite pas si tu as des bugs 😊
|
34
qfdk OP PRO @bowencool #30 感谢反馈,这些引导,说实话没有太好好做,抱歉带来的困扰.
这个问题有 V 友反馈了,这是后面需要优化的地方,一开始是个个人用的产品. 稍后我会发一个特别的授权发给特别的你! |
35
qfdk OP PRO @Vnaner 感谢反馈,记录下了. 因为初衷是 自己用又跟手的输入,没有考虑跨平台.
也是因为没有跨平台,安装包才 8M 左右,到时候出来 windows 版本少不了老哥帮着打磨 |
37
tojonozomi 16h 30m ago 感谢 op ,最近键盘敲多了,手腕不是很舒服,也在找语音输入法,马上试试
|
38
clockcloud 16h 16m ago 感谢分享,试试
|
39
notaCoder 16h 7m ago 和 TypeWhisper 比,有什么独特的地方吗,以前用 Whisper Transcription ,但是后来有的模型要花钱就换着试了好几个,不想再换了
|
42
qfdk OP PRO @notaCoder #41 不好意思我看错了, 以为你说的是 whisper,主要是像我这边做的都是 Soniox, elevenLabs,有 websocket 的加成优化,欧洲很舒服.终端一直在用,配合上靠谱的 API 准确率还是蛮高的,加上我这边有智能分词底层使用 jieba 分词,去掉奇怪的词语.
TypeWhisper 强在本地模型多 + 插件/CLI/批量转写更全,更像工具箱,马克下,看看有没有好的细节借鉴下 :) |
43
pierreoui12 13h 12m ago 佬兑换码用完了嘛,可惜看见迟了。
Quel dommage que je n'aie rattrapé ça que maintenant ! C‘est un bon logiciel ! |
44
pierreoui12 13h 4m ago
哎,罢了,还是考虑一下自购一份支持吧
|
45
qfdk OP PRO @pierreoui12 #44 Yo Pierre, tkt ! 私我,给你单独开个授权! 100 份发完了.
|
46
netconf 7h 24m ago via Android 老哥,求一个兑换码 OTY4ODI4QGdtYWlsLmNvbQ==
|
47
seelight 6h 50m ago 虽然来晚了一点, 不过大佬的 landpage 做的好 fashion, 即便有 vibe 个人审美也是很好的, 字体和排版都很有让人试用的欲望:)Super, je valide
|
48
mirror 5h 31m ago 早鸟票忍不住想氪一个
|
49
Lituby 5h 7m ago via Android 感谢分享,求个码,谢谢
bGl0dXJpYnlAb3V0bG9vay5jb20= |
50
Livid MOD PRO |
51
pierreoui12 2h 23m ago @qfdk Merci bcp ! Je vous ai envoyé un email sur votre gmail nommé "Voilà App 授权申请 - V2EX pierreoui12",bonne continuation !
|
53
qfdk OP PRO @pierreoui12 #51 Bien reçu et voilà ta licence !
|
56
netconf 2h 1m ago via Android
感谢大佬
|
59
doubu 59 mins ago via iPhone
来晚了,大佬,求一个码,谢谢
NnNwb3QwN0BnbWFpbC5jb20= |