您的位置:首页 > 运维架构 > Linux

Unbuntu16.04+Kaldi本地运行timit语料(完整版)

2017-10-03 20:50 483 查看
TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割,标记。70%的说话人是男性;大多数说话者是成年白人。

首先准备数据集

将数据集放再kaldi/egs/timit/data/中解压

rar x timit.rar


注:若没有安装rar,可根据相应的提示安装

然后修改s5文件里的脚本文件
(1)修改run.sh

第30行

feats_nj=10
train_nj=20
decode_nj=5
第39行 timit=/home/Michael/kaldi/egs/timit/data/timit  此处为设置数据路径

(2)修改cmd.sh

export train_cmd=run.pl
export decode_cmd=run.pl
export mkgraph_cmd=run.pl
export cuda_cmd=run.pl
其他的均注释掉

接着安装irstlim

进入kaldi/tools/extras/下,执行命令

./install_irstlm.sh
安装完毕之后,执行命令

cp irstlm ../


最后,进入s5文件运行run.sh

./run.sh


实验运行ing。。。

后续再写结果分析吧
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  ubuntu linux gpu
相关文章推荐