标签:ESPnet

13个优秀开源语音识别引擎

语音识别(ASR)在人机交互方面发挥着重要的作用, 可用于: 转录, 翻译, 听写, 语音合成, 关键字定位, 语音日记, 语言增强等场景. 语音识别基本过程一般包括: 分...