比如会议录音记录的不同人发言区分
A:这是一句话 aaaaa
B:这是一句话 bbbb
A:这又是一句话 AAAAa
A:这是一句话 aaaaa
B:这是一句话 bbbb
A:这又是一句话 AAAAa
1
MaoshuoChen Apr 9, 2023 这个任务叫说话人识别( Speaker Identification ),
方案: https://github.com/openai/whisper/discussions/264 |
2
l0wkey OP @MaoshuoChen #1 感谢,我在您提供的 discussion 里面找到了 whisperX ,一站式提供了这个能力,虽然还是 beta 。
``` https://github.com/m-bain/whisperX Diarization (still in beta, add --diarize) 分离说话者(仍处于测试版,添加 --diarize ) ``` |