RichardY
V2EX  ›  问与答

有什么开源的语音识别工具

  •  
  •   RichardY · Sep 1, 2025 via Android · 2037 views
    This topic created in 266 days ago, the information mentioned may be changed or developed.
    whisper 试了很多次,准确性很差。基本上每句话都是错的。一句很短且标准的语音,都能识别错。也不知道是不是我用的不对。

    有没有对中文比较友好的开源语音识别工具?
    7 replies    2025-12-07 21:36:54 +08:00
    TimePPT
        1
    TimePPT  
    PRO
       Sep 2, 2025 via Android
    拥抱脸上很多呀,找几个支持中文的试试应该能找到
    https://huggingface.co/models?pipeline_tag=automatic-speech-recognition&sort=trending
    wangxiaodong
        2
    wangxiaodong  
       Sep 2, 2025
    离线工具的受制于 AI 大模型体量,估计都不怎么样,还得是 Google Gemini 的普通话云端 STT 效果比较好,网上甚至有免费识别声音并直接生成字幕的,你可以试试看:
    https://passed.app/main/more/online/speech-to-text/
    ejin
        3
    ejin  
       Sep 2, 2025
    说到这个来个题外话,腾讯混元(元宝) app 识别率还行,虽然识别中英文混合的容易出错,但是它总是瞎编最后一句话。。。。我每次都眼睁睁看着他瞎编的最后一句话。。。。
    woshizhuwow
        4
    woshizhuwow  
       Sep 2, 2025   ❤️ 2
    我一直用这个当输入法,用起来感觉效果还蛮不错,可以试试
    https://github.com/HaujetZhao/CapsWriter-Offline
    avrillavigne
        5
    avrillavigne  
       Sep 2, 2025
    用的 faster whisper 吗
    Alexf4
        6
    Alexf4  
       Sep 2, 2025
    阿里的几个开源的模型识别的效果还行。
    supermama
        7
    supermama  
       Dec 7, 2025
    群主最后选了哪个开源的 语音转文本模型
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   983 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 60ms · UTC 22:09 · PVG 06:09 · LAX 15:09 · JFK 18:09
    ♥ Do have faith in what you're doing.