百度提供免费的语音接口,想做个实时语音转写文字的 app,特此发帖求推荐哪些源码项目比较合适?
想借鉴某些源码思路,写个字幕式的,效果和小米闻声 app 差不多吧
可以求讯飞听见,小米闻声 app 类似的源码?
我不知道小米闻声怎么做到实时转写文字的,我能想到的无非分割音频文件,每个音频 1s,转成 PCM 格式进行上传,等收到数据包提取转换后的文字再输出,但一句话说完,这句话的音频文件转换后的文字没法看。。。
1
ch2 2021 年 5 月 12 日
语音识别你分割了就丧失了前后文语境,肯定识别不出来的
你想要实时的那就是本机实时预测,具体怎么做是人家的商业秘密,不可能让你白嫖的 |
3
ALLROBOT OP 免费不行,就上付费的
|
4
cutemurphy2888 2021 年 5 月 12 日
腾讯的同声传译
|
5
gainsurier 2021 年 5 月 12 日
苹果本地有 api 可以直接调用
|
6
agoodob 2021 年 5 月 12 日
实时? websocket 呗。
如果不用实时的,而且手头有 .mp3 .aac 等音视频文件希望拖到一个程序里直接转文字,看一下: https://github.com/1c7/Translate-Subtitle-File |
7
inhzus 2021 年 5 月 12 日 via iPhone
直接用现成的实时语音转文字,已经非常成熟了,别折腾自己。阿里云、腾讯等等都有,市场价 1-2 元每小时
|
8
ethanlu 2021 年 5 月 12 日
|
10
ALLROBOT OP @gainsurier 苹果没试过,可以去试试
|
11
ALLROBOT OP @gainsurier 你这么一说,我想起了微软好像也有,我去瞧瞧
|
13
ALLROBOT OP @inhzus https://ai.baidu.com/ai-doc/SPEECH/qk76b444d 已经在看百度语音的 sdk 手册了
@agoodob 了解 websocket 了,语音识别我没怎么接触,第一次接触这方面的。。。抱歉哈,在看 sdk 手册了,如楼上所言,根据 sdk 进行开发吧 |
14
muhuan 2022 年 1 月 30 日
楼主最后选择的哪个?我也有一些 1h 左右的语音,想转化为文本
|