1
sakujo 362 天前
是不是聪明一点的小爱音响?那倒是挺不错的
|
2
Jackyxiaoc OP @sakujo 是的,用来哄哄小朋友什么的,练习下英文对话啥的,看上去还不错。
|
3
sakujo 362 天前
@Jackyxiaoc #2 有点意思 不过如果问它有用的信息它会胡说八道啊 这样没办法当语音助手了
|
4
lloovve 362 天前 via iPhone
你能保证稳定才行,树莓派太贵,直接上 esp32
|
5
demen 362 天前
其实交互过程感觉挺难受,你问一个问题之后几十上百字的内容用语音播放来听取?平时我们微信聊天看到超过 10s 的语音都有点翻白眼了吧
|
6
mway 362 天前
有兴趣
|
7
luckjoe680 362 天前 via Android
问题是 小爱音箱就能办到了…也用不了 300 啊…
|
8
musi 361 天前 via iPhone
太贵了,为啥不用手机?
|
9
Tink 361 天前
树莓派太贵了
|
10
Tink 361 天前 2
这个价格不如买黑板的初代小爱音箱,破解 ssh 后 劫持语音转到 c hatgpt
|
12
yuchenxing 361 天前
怎么搞
|
13
hoky 361 天前 via iPhone
为什么不直接用闲置的手机?
iPhone 用 Siri Android 用 Tasker 我都试过玩过一阵子 后来因为直连 openai 响应慢玩的不多了 |
14
totoro625 361 天前
iPhone 安装 OpenCat: https://apps.apple.com/app/opencat/id6445999201
填入 api key ,开启高级版,并开启 Siri 支持 任意支持 Siri 的 iPhone/apple watch 均可用 Siri 调用 chatgpt 进行对话 |
15
Biluesgakki 361 天前
如何做到流式传输结果 传回来一个字读一个字呢。不然的话响应时间太长了,需要等到全部返回结果才开始读
|
16
timeance 361 天前
1. 树莓派的方案太贵
2. 硬件部分,基本功能调通,麦克风如何降噪拾音等 3. 软件部分怎么完善,例如 prompt ,唤醒和本地识别语音指令等 ... 想法挺好的,要是真有完善的方案 会买一个来玩 |
17
yfmir 361 天前
就目前这 api 的连接环境来看还是算了吧
|
18
littleBink 361 天前
gpt 大部分回答都很长且书面,需要测试大量的 prompt 来优化
|
19
aeli 361 天前
反应速度现在还不太行,GPT3 的回答虽然快,也要 1-2 秒,然后再转成语音发声,延迟会感觉比较明显的卡顿。
GPT4 就不用说了,能正常时间内给你返回就不容易了 |
20
zagfai 361 天前
可以接入米家就行,我不需要很智能,当然,我能给出传感器数据能帮我判断我是不是睡醒,自动开关窗帘,判断我啥时候会回家自动帮我开空调,那也不错。
|
21
ropzislaw 361 天前 via Android
这个 idea 我也有过,最后被劝退了
1. 需求多了生产线怎么弄,如何保证自己的生产线成本低 2 延迟和输出延迟 3 实时数据缺失 |
22
Jackyxiaoc OP @mway 感谢。
@luckjoe680 小爱的智能水平和 chatgpt 不太一样。 @lloovve 感谢,我研究下。 @musi 在家常驻使用比较舒服。 @Tink 确实是个好办法,感谢。 @yuchenxing 我研究下路径,如果可以的话,一起拼个单,组好了大家用,成本就下来了。 @hoky 还是得有稳定的通道。 @totoro625 长时间接着电源的小音箱在家小朋友什么的好玩。感谢,我研究下。 @Biluesgakki 流式的话,这个得研究下。大概 10 个字一读会不会好点。 @timeance 感谢支持,我研究下。 @yfmir 估计得内置一个通道才行。 @aeli 目前看是的。看看有没有更好的解决方案。 @zagfai 如果更智能应该是个更好的体验。 @ropzislaw 只是一个初步想法,天猫精灵的话二手成本是挺低的。如果单纯是树莓派的解决方案,树莓派也不会很贵。延迟这个通道可以解决。实时数据的话,可以导入谷歌的。 感谢各位大佬们的建议。 |
23
tags 361 天前
不错不错,可以先在 linux 虚拟机上把系统搭起来,后面用啥硬件平台可以再说
|
24
Socrazy 361 天前
Siri 上用了,其实很无聊,简单问题还行,太长的听起来很累
|
25
freetree 361 天前 via Android
华强北听到了你的呼求😁
|
26
yulgang 361 天前
想法不错,但是树莓派成本有点高。。
|
28
yulgang 361 天前
如果你能开源的话,大家喜欢,可能会衍生出多个版本,不过一定会有人用你的开源代码拿去赚钱。😂
|
29
Jackyxiaoc OP |
30
dangyuluo 361 天前
直接用 Siri 就可以接入 ChatGPT 了
|
31
Jackyxiaoc OP @dangyuluo 不知道咸鱼上 300 的 6s 能不能跑,如果可以的话,也是不错的选择。
|
32
cloudzqy 361 天前
这种自己走微软云文字转语音的,一般用什么方案识别关键字然后开始对话呀,如果一直开着的话,微软云也挺贵的。
|
33
westoy 361 天前
做公开服务成本太高了吧
京东的那个叮咚音箱都倒闭了....... |
34
zapper 361 天前
看了一下(可能是生成的)产品介绍。发现好像没说如何正确地拾音给 chatgpt
所谓悲观者常常正确,乐观者往往成功。如果能接入插件将绝杀 |
35
tags 361 天前
唤醒词本地离线模型就能跑
|
36
Jackyxiaoc OP |
37
webdesigner 361 天前 via iPhone
从我使用 gpt 连接 siri 的体验来看,这个项目做出来体验会很差。api 目前要么用 sse 逐字输出,要么牺牲响应时间等待全部结果。逐字输出文字转语音效果会很差,一个一个字朗读。等待全部结果在朗读,用户响应时间特别长,你无法想象当你问完一个问题,就得等待十几秒钟来告诉你答案。如果这个方案可行,大厂早就整出来了。
|
39
wellqq 361 天前 via Android
按你目前的阶段,感觉离成品还有一些路要走,不过有出来体验好我会买,有众筹通知一下
|
40
fresco 361 天前 via iPhone
一直在找能语音对话的 app ,这个想法不错,成本低点就好了
|
41
luckjoe680 360 天前 via Android
@Jackyxiaoc 你可以看看 现在 chatgpt 现在已经有大佬接入小爱了 而且还很方便=.=
|
42
Jackyxiaoc OP @webdesigner 确实,可能还需要看看有没有更好的方案啦。
@wellqq 好的,谢谢支持。 @fresco 嗯嗯,谢谢。 @luckjoe680 如果有大佬折腾出来卖成品的话就不折腾了,等我看看,之前没看到。感谢提醒。 |
43
aeli 360 天前
如果说成品的话,找 amaon 的音箱,它家的很容易开发改第三方,YouTube 上有人放出来教程改 ChatGPT 的
|
44
Smackgg 360 天前
小爱 小度 自己写一个插件不就做到了?小度六七十块钱就能买到
|
45
xuelu520 360 天前
需要短平快的对话,gpt 一大堆文字,给你转成语音,太难受了
|
46
xinyana 360 天前 via Android
墙的问题怎么搞定?内置墙?
|
47
xsen 360 天前
现在 chatgpt 的模型,只适合用来替代搜索引擎、客服类似的
用来做 ai 助理(语音对话)是真不合适,长篇大论、废话太多 |
49
cloudzqy 360 天前
@webdesigner 这种可以折中一下,识别到标点符号断句就开始读,一句一句读,比小爱音箱什么的肯定慢,但是应该没十几秒。
|
50
luobogooooo 360 天前
笑到了,哈哈哈
|
51
hoopan 359 天前
家里有台待机的 NAS ,增加个麦克风、音响,是不是也能搞成 AI 音箱。
有基于 chatgpt 的语音助手开源服务端吗? |
52
swxk521 359 天前
|
53
unii23i 358 天前
这个真的很需要!我经常和天猫精灵对线
|
54
zsrex 347 天前
这个我感兴趣,之前折腾了一下 wukong-robot ,但 ubuntu 的系统太难搞了,可能我没有这个基础。
|