未加星标

Linux 使用 pocketsphinx 做中文语音识别

字体大小 | |
[系统(linux) 所属分类 系统(linux) | 发布者 店小二05 | 时间 2019 | 作者 红领巾 ] 0人收藏点击收藏

前一篇博客说了一下怎么在 windows 平台使用 pocketsphinx 做中文语音识别,今天看看在 linux 上怎办实现。

由于 pocketsphinx 没有提供 Linux 的二进制包,因此我们需要自己根据源码编译。

从下面地址下载源代码

https://sourceforge.net/projects/cmusphinx/files/

这里,我使用的是 sphinxbase-5prealpha.tar.gz 和 pocketsphinx-5prealpha.tar.gz。

编译 sphinxbase tar zxvf sphinxbase-5prealpha.tar.gz mv sphinxbase-5prealpha sphinxbase cd sphinxbase ./configure make sudo make install 编译 pocketsphinx tar zxvf pocketsphinx-5prealpha.tar.gz cd pocketsphinx-5prealpha ./configure make clean all sudo make install 下载模型文件

模型文件下载地址

https://sourceforge.net/projects/cmusphinx/files/Acoustic and Language Models/

其中 Mandarin 为中文普通话,下载之后我们可以看到

声学模型:zh_broadcastnews_16k_ptm256_8000.tar.bz2 (需要解压) 语言模型:zh_broadcastnews_64000_utf8.DMP 拼音字典:zh_broadcastnews_utf8.dic 测试中文语音识别 首先准备一个中文音频文件(要求:.wav 格式,采样频率 16000HZ,单声道) 将下载的中文模型文件和解压后的 pocketsphinx 目录放到同一个目录下,这里假定就叫 “test”。 进入“test”目录,然后运行下面的命令

pocketsphinx\bin\Release\x64\pocketsphinx_continuous.exe -hmm zh_broadcastnews_ptm256_8000 -lm zh_broadcastnews_64000_utf8.DMP -dict zh_broadcastnews_utf8.dic -infile myfile-16000.wav > myfile.txt 运行完毕后,查看 myfile.txt 文件,内容即是程序识别出来的中文。

本文系统(linux)相关术语:linux系统 鸟哥的linux私房菜 linux命令大全 linux操作系统

代码区博客精选文章
分页:12
转载请注明
本文标题:Linux 使用 pocketsphinx 做中文语音识别
本站链接:https://www.codesec.net/view/627822.html


1.凡CodeSecTeam转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
登录后可拥有收藏文章、关注作者等权限...
技术大类 技术大类 | 系统(linux) | 评论(0) | 阅读(52)