Python语音识别转中文怎么做?Python如何识别音频并转为中文文本

【Python语音识别转中文怎么做?Python如何识别音频并转为中文文本】在之前的文章中小编已经给大家介绍过了python该怎么去实现音频转文字 , 但是它只能够识别英语而无法去将普通话给识别成中文 。而下面要来介绍的内容就是python音频识别转中文的方法教程 , 感兴趣和想学习的小伙伴就要继续往下阅读文章了 。

Python语音识别转中文怎么做?Python如何识别音频并转为中文文本

文章插图
1.python内音频转文字一般使用的都是第三方库speechrecognition , 而它在安装之前还是需要去安装一个配置项pocketsphinx , 此配置项就决定了音频转文字库能够去识别的语言有哪些 。所以首先通过pip命令将它们都下载安装好 , 这样才能执行下一步操作 。
2.因为pocketsphinx内自带的音频识别只支持英语 , 所以还需要去下载另外的插件才可以 。打开浏览器并定位到网址栏 , 复制下方的网址后粘贴并进入 , 链接如下所示:
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Mandarin/在这个网页之中找到以cn为结尾的tar.gz压缩文件下载下来 , 注意需要选择版本最新的那一个 , 否则可能会出现不匹配而无法使用的情况 。
3.下载完成之后需要将它们先解压到桌面方便复制 , 解压完成之后会有一个三级的文件目录 。按照从外向里的顺序找到文件夹和文件将它们进行重命名 , 示例如下:
cmusphinx-zh-cn-5.2>zh-CNcmusphinx-zh-cn-5.2>acoustic-modelzh_cn.lm.bin>language-model.lm.binzh_cn.dic>pronounciation-dictionary.dict4.重命名完成之后将这个zh-CN文件夹复制并且粘贴在python安装目录内的指定目录中 , 如下所示:
python3.6/site-packages/speech_recognition/pocketsphinx-data然后在编写代码时将模块导入并且去调用recoginze_sphinx()这个识别音频转为文字的方法 , 不过需要在方法之中将参数language的值设置为中文才可以 , 详细代码示例如下所示:
import speech_recognition as srr = sr.Recognizer()sudio = ’’with sr.AudioFile(‘output.wav’) as src:  sudio = r.record(src)print(recoginze_sphinx(sudio,language=“zh-CN”))以上就是关于“Python语音识别转中文怎么做?Python如何识别音频并转为中文文本”的全部内容了 , 希望对你有所帮助 。

    推荐阅读