V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
287854442
1.32D
V2EX  ›  Joe's Talk 🪐

一个大胆的预言:语音输入将成为绝对主流

  •  1
     
  •   287854442 · 17 小时 5 分钟前 via Android · 7184 次点击

    先说结论:大概 1~2 年之后,语音输入在移动设备上将会成为主流的输入方式。文字输入基本被淘汰,就跟现在基本没有人会用手写输入一样。

    为什么?因为效率。

    一个操作熟练的一般人大概每分钟能打 80~100 个汉字,人的说话速度大概是每分钟 160~240 个汉字。

    现在 AI 语音输入法可以识别得非常快,非常准确,基本上可以跟上说话的速度。比如说我写的这一段,用的是豆包的语音输入(利益不相关,纯佩服),一个错别字都没有改过(最多是修改一下标点符号。)甚至一些很生僻的词也能识别出来。

    当然,随着这个预测的出现,另外一个是谁能把握到这个语音输入的机会(包括软件和硬件),谁可能就会成为未来输入的统领者。这个预测的一个很大的变数是 AI 时代语音输入法门槛会比较低,做一个九十分的语音输入应该都不是一个很复杂且很费劲的事情。比的是谁能做到 99 分。

    你觉得呢?

    第 1 条附言  ·  16 小时 22 分钟前
    为了避免歧义这里稍微补充一下这里所说的 “语音输入” 的含义:

    语音 -----AI-----> 文本

    就是现有很多输入法中的 按空格说话,然后用 AI 识别语音成文本,并不是 微信中的 发语音,这是两个事情, 后者也不需要预测了
    第 2 条附言  ·  7 小时 0 分钟前

    看到很多留言让我想到 慈禧第一次看见汽车如何评价:跑这么快要吃很多草吧

    慢慢来吧,时间会说明一切

    一点点小建议:AI 时代,拿3个月之前的东西来说事儿可能都是脱钩的,keep your mind open, keep up and catch up

    Solana
    V2EX 支持通过 Solana 网络向内容作者打赏
    JoeJoeJoe 打赏了 20 $V2EX
    180 条回复    2026-01-28 06:56:10 +08:00
    1  2  
    opengps
        1
    opengps  
       17 小时 1 分钟前   ❤️ 44
    我都不爱说话,让我用语音输入?
    lqy2575395
        2
    lqy2575395  
       17 小时 1 分钟前   ❤️ 3
    不太可能,一天本来就打不了几个字,高频打字的场景也就上班时间,整个办公室都在语音输入,不得不跟菜市场一样
    shadowyue
        3
    shadowyue  
       16 小时 58 分钟前   ❤️ 7
    嗓子:我耐久度比手低
    287854442
        4
    287854442  
    OP
       16 小时 58 分钟前 via Android
    @opengps 不爱说话是个好习惯。
    @lqy2575395 没事,所以说是个预测嘛。如果大家都觉得个必然趋势,那我也就没有预测的必要了。 其实说话声音不一定很大,窃窃私语都已经完全够使用了。而且我觉得这个不是个问题。大家都用的时候,就都不奇怪了。想想口罩.
    Krylo
        5
    Krylo  
       16 小时 58 分钟前 via iPhone   ❤️ 2
    用嘴表达自己的即时思维,其实有难度。
    night98
        6
    night98  
       16 小时 56 分钟前
    输入法这玩意我只信任本地模式
    loading
        7
    loading  
       16 小时 56 分钟前 via Android
    冷知识:大部分输入法按住空格就是语音输入。

    能不能别发语音。
    287854442
        8
    287854442  
    OP
       16 小时 56 分钟前 via Android
    @Krylo 没错,哥们,你肯定是一个很懂表达的人。其实大部分人都是张口就来,根本不关心什么思维,🐶
    loading
        9
    loading  
       16 小时 54 分钟前 via Android
    我觉得 op 不知道手机输入法直接就能语音转文字,不用去豆包的。这玩意已经出现很多年了。
    ice000
        10
    ice000  
       16 小时 54 分钟前   ❤️ 1
    语音相当于广播.......
    287854442
        11
    287854442  
    OP
       16 小时 52 分钟前 via Android
    @night98 没毛病
    @loading 我特烦别人发语音,除了我妈
    shortawn
        12
    shortawn  
       16 小时 51 分钟前   ❤️ 1
    不可能。语音输入法的保密性为零,仅凭这一点,绝不可能成为主流。除非什么时候可以发展到仅识别唇形而不采集声音就能完成输入。
    jjianwen68
        13
    jjianwen68  
       16 小时 51 分钟前
    现在法庭上类似书记员的职位淘汰了吗,以及其他类似场景
    liu731
        14
    liu731  
    PRO
       16 小时 51 分钟前
    其实打字有一个优势,就是高密度、快速校验要表达意思。在发送前核对 0.5s 就行
    287854442
        15
    287854442  
    OP
       16 小时 50 分钟前 via Android
    @loading 知道的,之前苹果自带输入法,微信输入法什么的,我也已经用了很久了,但是它们准确率不太高。有一半的情况都需要再手动改。但是豆包输入法我试用下来基本上是 20 次需要改一次,觉得是可以到一个日常可以使用的级别。
    tetora
        16
    tetora  
       16 小时 49 分钟前
    意念(默读)输入
    dushixiang
        17
    dushixiang  
       16 小时 49 分钟前
    你的字体怎么有点特殊?
    Building
        18
    Building  
       16 小时 48 分钟前   ❤️ 3
    罗永浩给你点了个赞
    287854442
        19
    287854442  
    OP
       16 小时 46 分钟前 via Android
    @shortawn 所以说是个预测,可以等等看,至少在移动设备上,我感觉这个预测的概率还挺高的。

    @jjianwen68 我觉得这不是同一个问题。针对你这个问题,我觉得是录像和录音可以完美取代书记员这个职位。

    @liu731 校验本身都是要做的。在不出错的情况下还好,出错的情况下,就需要改了。目前输入法的准确率,我觉得都还差一些。
    287854442
        20
    287854442  
    OP
       16 小时 44 分钟前 via Android
    @dushixiang 啊,有吗?没注意到呀。

    @Building 哈哈哈哈

    @tetora 这个太高端了,但搞不好有生之年还真能见到,马斯克那个脑机接口,真搞下来的话...
    lneoi
        21
    lneoi  
       16 小时 43 分钟前
    不用语音输入,微信的发送语音就是这领域的代表。看看现在是打字的多还是发语音的多就知道了
    evill
        22
    evill  
       16 小时 42 分钟前   ❤️ 1
    ”文字输入基本被淘汰“ 给你一些场景,公共场合比如地铁、公交、办公室
    这些场合都不适合语音
    catazshadow
        23
    catazshadow  
       16 小时 41 分钟前 via Android
    1980 年代的科幻片已经预测过了
    Govin
        24
    Govin  
       16 小时 41 分钟前
    微信语音我几乎不用,跟长辈聊天都是打字的,你跟我说要成为绝对主流?
    IIce
        25
    IIce  
       16 小时 41 分钟前
    打字打错了能删除,说错了咋删除呢
    evill
        26
    evill  
       16 小时 40 分钟前
    还有一个问题,语音转文字就是纯文字
    而手打文字会有表情符号、谐音梗、表情包等,这些语音转文字代替不了
    Sawyerhou
        27
    Sawyerhou  
       16 小时 39 分钟前
    一两年之内估计比较难,有生之年有可能,不过应该也是个过渡形态,终极形态应该是脑机接口,意识流输入。
    MoonShot
        28
    MoonShot  
       16 小时 36 分钟前
    语音只能说是辅助输入,最终极的交互还是要到脑机层面
    guqikang
        29
    guqikang  
       16 小时 33 分钟前   ❤️ 15
    “小声点,你吵到我用 TNT 了!”
    Gilfoyle26
        30
    Gilfoyle26  
       16 小时 30 分钟前
    啊? 2026 年 OP 才得出这个结论么?微信的成功就是因为可以发语音,这点极大的扩展了使用人群,才有了今天的微信。而微信语音功能是 2011 年 5 月 10 日 随着微信 2.0 版本 的发布而正式推出的。也就是 15 年前。
    dawee2y
        31
    dawee2y  
       16 小时 26 分钟前
    招笑预测
    7gugu
        32
    7gugu  
       16 小时 24 分钟前
    确实,特别是用过豆包之后就让我意识到这个可能了。豆包对于中英文数字混合识别的能力,非常强大,很多专业术语可以直接说,豆包都能够正确识别出来。而且分词能力也很强大,能准确的识别语气词和正文,现阶段豆包输入法已经有一部分的功力了。
    renmu
        33
    renmu  
       16 小时 23 分钟前 via Android   ❤️ 1
    老罗领先世界十年!
    shaozelin030405
        34
    shaozelin030405  
       16 小时 23 分钟前
    想多了,纸质媒体到现在还没死呢。微信语音都多少年了,你是 gg 还是 mm ?
    wu67
        35
    wu67  
       16 小时 22 分钟前
    爱不爱说话是一个问题.
    在公共场所说话也是个问题. 有些东西合不合适、内容敏感与否...
    在办公室同上...
    stinkytofux
        36
    stinkytofux  
       16 小时 20 分钟前
    语音输入法至少已经有十几年的历史了, 最早讯飞就是专门做这个的. 而且现在所有输入法都带语音输入, 甚至 IOS 的右下角常驻语音输入按钮.

    跟现在的 AI 根本没有任何关系. 这玩意成不了绝对主流, 也可以说早就成为主流输入方式之一了. 不爱用的人不会用, 爱用的人早就用上了.
    location123
        37
    location123  
       16 小时 20 分钟前
    单纯 vibe coding 或者讨论需求代码 来说 我喜欢语音输入 描述一个需求的时候 我打字只会打一点 剩下让 ai 猜 而语音输入我能说的很详细
    cmdOptionKana
        38
    cmdOptionKana  
       16 小时 16 分钟前 via Android
    一般人独处的时间不够多,不足以形成语音输入的习惯。
    bruce0
        39
    bruce0  
       16 小时 16 分钟前   ❤️ 2
    还好你限定场景是移动端,要不然我不敢想,每天公司一群人在朗读代码是什么场面

    int main() {
    ......
    return 0;
    }

    朗读出来, "因他, 空格, 们, 左括号,有括号,座花括号,..... 瑞 ten 零,分号,右花括号" 😂😂😂
    sudodo
        40
    sudodo  
       16 小时 15 分钟前
    楼主确实听大胆的
    CaptainD
        41
    CaptainD  
       16 小时 11 分钟前
    绝无可能,最主要的原因是语音效率远低于文字

    如果语音的效率更高,那么播客类 app 应该常年是 app store 下载前几,但显然是图文和视频,小红书、抖音、YouTube 就是几个现实例子

    视频的效率其实比较低,但胜在简单,而文字,尤其是图文结合效率远大于语音和视频
    DigitaIOcean
        42
    DigitaIOcean  
       16 小时 10 分钟前
    我语音输入占比 50%
    NakeSnail
        43
    NakeSnail  
       16 小时 7 分钟前
    我也是这么认为,至少会需要新的输入方式了,vibe coding 多了就感觉打字也很累
    NakeSnail
        44
    NakeSnail  
       16 小时 6 分钟前
    @bruce0 你这个忽略了 ai 的作用,实际场景可能会变成说出你的需求,ai 帮你处理这些东西
    287854442
        45
    287854442  
    OP
       16 小时 5 分钟前
    @bruce0 哈哈哈哈
    @DigitaIOcean 我也差不多,还日益增加

    =============
    怎么上面还有说用微信语音呢,这都什么时代的玩意儿了
    Muniesa
        46
    Muniesa  
       16 小时 4 分钟前 via Android
    正在感冒的我感觉不大行
    hahiru
        47
    hahiru  
       16 小时 4 分钟前
    你尝试一下就知道了。输入文字我可以斟词酌句,语音输入是什么情况?
    额,这个,然后么,……,反正就,然后吧,卧槽,哎不对,那家伙…………………………

    弄成口语化文字的话,除非大模型能准确转译口语为书面语。
    而且我自己打错字了我可以忍,因为是我马虎了。你让我回过头检查 AI 有没有理解错误或者打错字,那我不能忍。我还不如自己打字。
    HotieCutie
        48
    HotieCutie  
       16 小时 3 分钟前
    绝对不会是主流,除非大家都不会打字了。打字是可以组织语言的,可以随时删除,但是语音不行,说错一点就得重新来
    zhoiiiii
        49
    zhoiiiii  
       16 小时 3 分钟前
    还真别说,我家里现在除了我,发微信都喜欢语音转文字
    287854442
        50
    287854442  
    OP
       16 小时 1 分钟前
    @NakeSnail 是的,vibecoding 的时候感觉打字太费劲了
    287854442
        51
    287854442  
    OP
       16 小时 1 分钟前
    =======================
    =======================
    =======================
    =======================
    287854442
        52
    287854442  
    OP
       16 小时 0 分钟前
    这里说的不是 [发语音]
    =======================
    =======================
    =======================
    =======================
    jjwjiang
        53
    jjwjiang  
       15 小时 59 分钟前   ❤️ 1
    典型的码农思维想产品,你随便找个上班的人问问,他一天有多少时间可以放肆的说出自己想打出的字?
    287854442
        54
    287854442  
    OP
       15 小时 56 分钟前
    @jjwjiang 哈哈哈哈哈
    @shaozelin030405 gg/mm 应该可以追溯到 QQ 时代了,2005 年左右
    spencer00
        55
    spencer00  
       15 小时 56 分钟前
    @loading 重点是豆包语音输入好用呀,自动的基本上都不行
    zerovoid
        56
    zerovoid  
       15 小时 55 分钟前
    语音输入早就有了,我记得当年锤子手机就有一个什么语音的功能,影响语音输入的不是识别准确率,而是使用场景,你在公司和家里也用语音输入吗,那不得被人直接轰出去。
    xFrye
        57
    xFrye  
       15 小时 53 分钟前
    嘘,吵到我用 tnt 了
    ethusdt
        58
    ethusdt  
       15 小时 52 分钟前
    跑个题,你这个主题内容和附言字体为什么和其他的(帖)不一样?
    YLGG
        59
    YLGG  
       15 小时 51 分钟前
    公共场合不适合语音 这就注定不能成为主流
    adimn
        60
    adimn  
       15 小时 50 分钟前
    还是喜欢打字, 因为打字的空余我会想后面该说的话

    写代码的人打字快的是不是比打字慢的技术高一样
    BelovedOne
        61
    BelovedOne  
       15 小时 50 分钟前
    @ethusdt 我也想问,为啥这个帖子的文字是宋体。。。
    dajj
        62
    dajj  
       15 小时 49 分钟前
    费嗓子,你能一天说 8 小时吗,加班的时候说 10 小时
    fionasit007
        63
    fionasit007  
       15 小时 47 分钟前
    总结了一下,这么多问题,op 就没想过吗,还预测
    1 ,正确率不可能百分百,中间出错修改成本比手写大;
    2 ,语音识别没人的个性,发送其他非常规文字(谐音梗表情包图片之类的),不喜欢加标点符号,加各种标点符号之类的;
    3 ,有的文字只会写不会读(现在输入法支持你认一半,会把这个字放进错误拼音里),还有单词也是只会拼不会读;
    4 ,用手写和用口读人的表达不一样,一般手写更加完整更好的表达输出人的意图;
    5 ,大多数环境语言输入不方便;
    6 ,安全与隐私风险和高精度肯定需要网络;
    kfpenn
        64
    kfpenn  
       15 小时 46 分钟前
    你说的是 TNT 吗?
    thealert
        65
    thealert  
       15 小时 45 分钟前
    不如相信 脑机接口
    kaishi123
        66
    kaishi123  
       15 小时 45 分钟前
    反正我一个人或者开车的时候,回微信都是语音转文字。只不过都是最基础的语音识别,没有试过 AI 修改或者润色。
    doruison
        67
    doruison  
       15 小时 45 分钟前
    不可能!
    公共场合你想下有些化方便说吗
    还有就是,楼上说的思维表达问题,非要书面不可
    WuSiYu
        68
    WuSiYu  
       15 小时 43 分钟前
    没隐私,还吵,不好编辑,全是缺点
    helloeather
        69
    helloeather  
       15 小时 41 分钟前 via iPhone
    再高端点,直接读取大脑的输出
    wangsd
        70
    wangsd  
       15 小时 40 分钟前
    我感觉不太行,语言输出太快了,大脑来不及思考,打字可以边打边思考。
    cfer
        71
    cfer  
       15 小时 40 分钟前
    未来肯定是脑机接口或者更先进的头戴外设之类的。语音就算了吧,打字都能打错更别说语音了。
    jonty
        72
    jonty  
       15 小时 39 分钟前
    手写输入>语音消息>语音输入
    lizongwu
        73
    lizongwu  
       15 小时 31 分钟前
    现在的人机交互受限于人的感官,要么视觉,要么听觉,随便乱猜也能 50%概率蒙对。下一次革命性的人机交互肯定是 neuralink 这种,绕过感官直接通过神经信号实现人机交互(拿好你的 tsla )。再说了,输入法就算做上天了又能怎么样
    nightlight9
        74
    nightlight9  
       15 小时 27 分钟前
    基本同意,豆包语音输入法已经很强了。差不多日常场景 30%会用语音输入
    比如我微信聊天经常都是用豆包语音输入文字。
    语音 --> 口语

    但专业性输出还是得 100%靠打字、代码、文章、文档等。
    不过这些应该也不是什么问题,AI 以后应该可以一键把口语化的东西转换成专业性的东西。
    语音 --> 口语 --> 专业性输出
    legendBro
        75
    legendBro  
       15 小时 26 分钟前
    楼主一定是公共场合刷抖音开外放的那种人
    milkpuff
        76
    milkpuff  
       15 小时 26 分钟前
    罗永浩时代的语音输入就已经非常准确可用,现在十来年了还没有成为主流。
    JoeJoeJoe
        77
    JoeJoeJoe  
    PRO
       15 小时 25 分钟前
    @legendBro 有点武断了.
    JoeJoeJoe
        78
    JoeJoeJoe  
    PRO
       15 小时 25 分钟前
    @dushixiang 因为我这个节点开了衬线字体样式
    vicalloy
        79
    vicalloy  
       15 小时 24 分钟前
    和 AI 交互的时候用语音输入确实挺方便的。
    不过很多时候不需要这么快的输入速度,用键盘输入,给自己留点思考的时间。
    craftsmanship
        80
    craftsmanship  
       15 小时 23 分钟前 via Android
    我最讨厌的就是微信语音 从来不用 也讨厌所有没有特殊情况就给我发语音的人
    11000111010
        81
    11000111010  
       15 小时 22 分钟前
    要说有可能的未来十到二十年或者更久之后 我倒觉得脑机接口有重大突破的话,让人类意识入网 可以通过意识输入文字这种。那个时候可能是主流了
    monkey110
        82
    monkey110  
       15 小时 21 分钟前 via Android
    所以安卓语音输入法最准的是哪个?
    nancyii
        83
    nancyii  
       15 小时 21 分钟前
    上班时候跟老婆聊天语音输入合适吗
    Hudiebbk
        84
    Hudiebbk  
       15 小时 21 分钟前
    s 手机端我现在基本都是语音转文字了,电脑端办公室不好一直逼逼
    Hyxiao
        85
    Hyxiao  
       15 小时 16 分钟前
    我还是挺期待语音输入对接 AI Coding 的场景的,虽然现在 cursor 也支持,但只是语音输入识别,而并非真正意义上的即时输入和响应,什么时候可以做到一边说话,代码一边改动,页面一边变化,可以随时打断调整,这体验真的直接拉满了
    june4
        86
    june4  
       15 小时 15 分钟前
    我就喜欢用语音输入。不过都 ai 时代了,一个能打的都没有。
    iOS 自带是垃圾,且 iOS 对第三方语音输入非常不友好。另外目前的语音输入似乎并没有上下文智能。总之改进的余地还是非常大的。
    GodIsJasonBourne
        87
    GodIsJasonBourne  
       15 小时 14 分钟前   ❤️ 1
    朕的黄金铲铲呢?朕要去挑大粪糊醒楼主了
    Dispatcher
        88
    Dispatcher  
       15 小时 12 分钟前   ❤️ 1
    以后再看到楼主这样逼逼叨叨的,直接一巴掌抽过去。

    为什么我相信文字的力量,而不是语音(包括转文字)的力量?因为,楼主这样的人,只单纯关注速度和识别率。
    实际上,这是低智能群体的最喜欢的东西,典型的华为思维、小米思维。

    抛开隐私,扰民等等索引因素,我只想说,表达速度快,真的就是正确吗?
    输入速度快,有什么意义呢?不经思考,脱口而出,只能是废话连篇。
    重视文字输入速度的,估计只有速记员。普通一年打字也就那几十万,平均下来一分钟,不论谁一百还是一百五的输入速度,有区别吗?非得你语音输入,二百五的输入速度,显着你了是吧?

    除了对线骂街,我是想不出超快速输入文字有何用?
    k2g
        89
    k2g  
       15 小时 11 分钟前
    有些人想到的东西可以直接通过语言说出来,但是有些人需要边想边组织成文字才能说出来,这样的话语音输入反而更慢了:
    想法 -> 语言 -> 屏幕文字
    vs
    想法 -> 脑内文字 -> 语言 -> 屏幕文字
    dyxLike
        90
    dyxLike  
       15 小时 5 分钟前
    只有输入大段句子的时候效率高, 短文本时不如手打
    Awes0me
        91
    Awes0me  
       15 小时 4 分钟前
    你这个字体好难看啊,怎么弄的
    evan9527
        92
    evan9527  
       15 小时 2 分钟前
    你一定知道 QWERTY 键盘的设计初衷确实不是为了追求打字速度,它的诞生是为了“慢”下来。从而降低打字速度,减少机械故障。
    如果用上语音输入,这种“故障”就会出现在人脑里,语音输入是一种连续线性的输出,很多人把话说顺畅的能力都没有。语音输入反复修改反而极大的降低效率。
    287854442
        93
    287854442  
    OP
       15 小时 1 分钟前 via Android
    @Dispatcher 表达想法,不管你赞同不赞同,我觉得都没问题,没必要骂骂咧咧的,上升到人身攻击吧?啥叫“逼逼叨叨”的?啥叫“低智能群体了”?这些还都能忍,竟然“小米思维” 这个忍不了 (哈哈哈哈
    @JoeJoeJoe 这里有个有人身攻击的。
    MrLeion
        94
    MrLeion  
       15 小时 1 分钟前
    开会和地铁上怎么破?
    JoeJoeJoe
        95
    JoeJoeJoe  
    PRO
       14 小时 56 分钟前
    @287854442 我只能删帖, 人身攻击的话直接 at livid 其他人没有这个权限
    287854442
        96
    287854442  
    OP
       14 小时 55 分钟前 via Android
    @monkey110 目前我觉得是豆包输入法。看谁能突破这个。

    @june4 可以尝试试试豆包输入法,在用豆包输入法之前,我一直以为语音输入还不行。它给了我一些惊喜。

    ------------

    豆包的产品在这吗?打钱。
    JoeJoeJoe
        97
    JoeJoeJoe  
    PRO
       14 小时 55 分钟前
    @ethusdt 看#78 我在这个节点设置了衬线字体样式
    287854442
        98
    287854442  
    OP
       14 小时 54 分钟前 via Android
    @JoeJoeJoe 没事儿,我觉得
    @Dispatcher 这老哥现实中大概率是个率直的人,说话很直接,哈哈哈
    JoeJoeJoe
        99
    JoeJoeJoe  
    PRO
       14 小时 54 分钟前
    @Awes0me 看#78 我在这个节点设置了衬线字体样式
    JoeJoeJoe
        100
    JoeJoeJoe  
    PRO
       14 小时 52 分钟前
    @Dispatcher
    @287854442 我还去扒拉了一下回复 没找到😂 这条回复我觉得还好, 是很有质量的回复了 有思考 有依据 是很认真的辩论
    1  2  
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1301 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 23:56 · PVG 07:56 · LAX 15:56 · JFK 18:56
    ♥ Do have faith in what you're doing.