V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
MuyuQ
V2EX  ›  程序员

千问推出了 PC 语音输入,功能和 typeless 差不多

  •  
  •   MuyuQ · 12h 5m ago · 1849 views
    巨头随手做的东西,就把一个创新赛道里的参赛者挤死大半。
    比功能,巨头随便投入点人力就能碾压。
    比营销,根本不是一个量级。
    比财力,比模型,这都没法比啊。。
    说的就是上半年国内蛮火的闪电说。
    更何况后面还有豆包的语音输入法蓄势待发。
    32 replies    2026-05-09 19:35:38 +08:00
    MuyuQ
        1
    MuyuQ  
    OP
       12h 1m ago
    有一篇爱范儿的广告可以大概了解下。
    https://www.ifanr.com/1664830
    Moonkin
        2
    Moonkin  
       11h 16m ago via Android
    这是啥新鲜玩意吗?把人说的话 stt ,文本送个本地小模型润色,不就行了。。。我有什么漏了的地方吗?
    ktyang
        3
    ktyang  
       10h 49m ago
    也不搞个 linux 的
    ChrisV5
        4
    ChrisV5  
       10h 45m ago
    有的,core 没啥技术含量,各家都有 tts 和 llm 。但是输入法的集成开发有很多很多细节。虽然 vibe coding 很快,但是都架不住生产级别的 bug 。有一定的工程量。
    hxzhouh1
        5
    hxzhouh1  
       10h 39m ago
    闪电说挺好用的,支持本地模型,自定义 api ,简单、纯粹。
    ko20
        6
    ko20  
       10h 24m ago
    诶,就没有哪家做一个 linux 这方面好用的客户端吗?目前 debian13+gnome48 用下来没一个满意的
    capric
        7
    capric  
       10h 14m ago
    原理是 asr(语音识别),llm 语义重组排版等
    有意思的是前向修正,比如你说“不对,不对”,它要理解你是否定前面说的
    另外评价标准也很意思,不是错字率而是意图达成率(是否需要手动编辑)

    typeless 开源替代
    https://github.com/cjpais/handy
    https://github.com/sypsyp97/light-whisper
    https://github.com/tover0314-w/opentypeless
    MuyuQ
        8
    MuyuQ  
    OP
       10h 2m ago
    @ChrisV5 是的。但开源的几个项目用起来都各有各的难受。目前最强还是 type less ,但是那玩意儿付费太贵了点。
    @capric 几个开源项目我也看过,维护是个问题,修 bug 不积极。而且差距还是挺明显的。
    @hxzhouh1 闪电说模型肯定没法和大厂比,自定义功能还是挺好用的。闪电说的优势是搭配豆包流式语音识别,但是等豆包也推出语音输入法的时候闪电说就没什么优势了。 闪电说的付费是 AI 助手,但这个方向肯定打不过千问和豆包。
    ChrisV5
        9
    ChrisV5  
       9h 28m ago
    @MuyuQ #8 因为我自己也手搓了一个,拿 rime + 豆包 asr + deepseek llm 。

    有些小问题,我自己能忍。但是发出去的话,bug 一堆。
    cutecore
        10
    cutecore  
       9h 7m ago
    豆包语音输入法发布都快半年了,官网 PC 版本还是敬请期待呢
    哪个输入法先出 linux 版本,我就支持哪一个
    hxzhouh1
        11
    hxzhouh1  
       8h 45m ago
    @ChrisV5 #9 您好,请问一下 rime 如何接入 豆包 asr 呢?
    ChrisV5
        12
    ChrisV5  
       8h 43m ago
    @hxzhouh1 #11 rime 的核心是开源的啊。拿 vibe coding 怼就行。大概跑一个 40 分钟的任务,就能跑起来吧。。
    ganbuliao
        13
    ganbuliao  
       8h 42m ago
    豆包的语音输入法 pc 有内测版本 我已经用一个月了
    很爽 就等豆包正式发布了
    winnerczwx
        14
    winnerczwx  
       8h 41m ago
    @Moonkin 想法和产品还是有差距的
    iorilu
        15
    iorilu  
       6h 19m ago
    这个就等巨头产品了

    除非是必须走本地
    auhah
        16
    auhah  
       6h 11m ago
    @ChrisV5 闪电说/typeless 都没走输入法路子,输入法相关的坑也不用踩啊。。。看上去主要功能就一条线,触发录音,丢给模型,回填内容
    ChrisV5
        17
    ChrisV5  
       6h 2m ago
    @auhah 回填内容没你想的这么简单,输入框的状态是非常不稳定的,他们走剪贴板,现在是个应用都读写改剪贴板。
    emberzhang
        18
    emberzhang  
       5h 54m ago
    豆包输入法 macOS 测试版我也试了下,问题在于它真是安装为一个输入法了,要把输入法切换到它的时候才能输入,如果状态栏的输入法切换到系统自带,就无法激活豆包的语音输入

    闪电说,lazytyper 这些压根就没按输入法安装,也就不用管系统限制
    lel020
        19
    lel020  
       5h 47m ago
    我希望语音输入归语音输入,输入法归输入法,语音输入法就很坑爹,挤占了输入法的位置,但作为输入法又垃圾的不行,
    AIXAPI
        20
    AIXAPI  
       5h 42m ago
    感觉这类产品的技术栈( ASR+LLM 润色)门槛不高,但工程细节拉满,比如实时流处理、语义纠错、输入法集成,大厂砸资源做出来的体验确实是个人项目比不了的。期待后面豆包的版本,也看看开源社区能不能跟上。
    madowenzy
        21
    madowenzy  
       5h 39m ago
    @ganbuliao Mac 端吧,Win 应该还没有
    HeyWeGo
        22
    HeyWeGo  
       5h 32m ago
    豆包的语音在 win 上的有办法用,v2 的人才提供的方法
    iorilu
        23
    iorilu  
       5h 26m ago
    @HeyWeGo 怎么用呢, 有链接吗
    yeh
        24
    yeh  
       5h 1m ago
    我和 https://sunp.eu.org/t/1202162 这位老哥一样,参考 https://github.com/yetone/voice-input-src ,codex 生成了一个 macos 下的来 vibe coding ,之后自己用的过程中发现了几个边界问题,补全了下边界,现在还挺稳的。

    输入端是 dji mic mini
    vvv222eeexxx
        25
    vvv222eeexxx  
       4h 55m ago
    @ganbuliao 可否共享一下,让大家先睹为快?
    Oo0
        26
    Oo0  
       4h 20m ago
    我也等个 Linu 版
    ebushicao
        27
    ebushicao  
       4h 5m ago
    智谱也有这个输入法,但本质就是语音转文字再用模型处理一下,我直接文字表达然后让模型处理一下效果应该会更好,毕竟文字输入还能检查一下,语音输入但凡讲多点就容易出错,而且涉及到一些专有名词的时候很容易错误,即便这种输入法都支持添加名词。
    raycool
        28
    raycool  
       2h 16m ago
    豆包输入法怎么还不发布 mac 端的
    XTTX
        29
    XTTX  
       2h 8m ago
    @ganbuliao 平时用来替代 cli 打字好用么?
    ganbuliao
        30
    ganbuliao  
       30 mins ago
    豆包的有需要可以试试
    6ZO+5o6lOiBodHRwczovL3Bhbi5iYWlkdS5jb20vcy8xN25DYUU2cTlHMjllaERSMlF6MTEydz9wd2Q9MVljNwrmj5Dlj5bnoIE6IDFZYzc=
    ganbuliao
        31
    ganbuliao  
       26 mins ago
    5oiR55So5aS45YWL572R55uY5YiG5Lqr5LqG44CMRG91YmFvSW1lSW5zdGFsbGVyX3YwLjUuNy56aXDjgI3vvIzngrnlh7vpk77mjqXljbPlj6/kv53lrZjjgILmiZPlvIDjgIzlpLjlhYtBUFDjgI3vvIzml6DpnIDkuIvovb3lnKjnur/mkq3mlL7op4bpopHvvIznlYXkuqvljp/nlLs15YCN6YCf77yM5pSv5oyB55S16KeG5oqV5bGP44CCCumTvuaOpe+8mmh0dHBzOi8vcGFuLnF1YXJrLmNuL3MvYjRmODkzZGQ0MDljCuaPkOWPluegge+8mnBGZjM=
    qW7bo2FbzbC0
        32
    qW7bo2FbzbC0  
       21 mins ago
    @ganbuliao #31 这个怎么用,官网没法下载 pc 版的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2886 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 104ms · UTC 11:56 · PVG 19:56 · LAX 04:56 · JFK 07:56
    ♥ Do have faith in what you're doing.