欧美free性护士vide0shd,老熟女,一区二区三区,久久久久夜夜夜精品国产,久久久久久综合网天天,欧美成人护士h版

目錄

柚子快報(bào)邀請(qǐng)碼778899分享:kaldi做語(yǔ)音識(shí)別

柚子快報(bào)邀請(qǐng)碼778899分享:kaldi做語(yǔ)音識(shí)別

http://yzkb.51969.com/

kaildi講解

kaldi是一個(gè)開(kāi)源的語(yǔ)音識(shí)別工具箱,是基于c++、perl、shell編寫(xiě)的,可以在windows和unix 平臺(tái)上編譯。

教程網(wǎng)頁(yè):http://www.kaldi-asr.org/doc/ 里面可以查閱語(yǔ)音/說(shuō)話人識(shí)別實(shí)現(xiàn)過(guò)程、kaldi的數(shù)據(jù)結(jié)構(gòu)、命令的使用說(shuō)明等。還有網(wǎng)上的dan的ppt。

kaldi下載:https://github.com/kaldi-asr/kaldi。

語(yǔ)音識(shí)別基礎(chǔ)知識(shí)快速入門(mén)

英文:《Speech and Language Processing》第9、10章。

中文入門(mén)方式可以看《語(yǔ)音信號(hào)處理》韓紀(jì)慶(編)的語(yǔ)音識(shí)別章節(jié);或者《模式分類》這本書(shū)的部分章節(jié)。

kaldi安裝

簡(jiǎn)要說(shuō)明:(運(yùn)行環(huán)境centos7、ubuntu16.4、macos 10.13都能安裝成功) 0、安裝前你需要對(duì)你的 linux 進(jìn)行配置,需要安裝的軟件apt-get、subversion、automake、autoconf、libtool、g++、zlib、libatal、wget,如何安裝見(jiàn)《kaldi的全部資料_v0.7(未完成版本).pdf》。

1、git clone https://github.com/kaldi-asr/kaldi.git 選擇某個(gè)路徑,下載kaldi。

2、在命令行cd到kaldi路徑下,cd到tool目錄下,在命令行分別輸入:

make -j?nproc

extras/install_irstlm.sh

install_irstlm.sh是安裝語(yǔ)言模型。

? ? ? ? extras/install_kaldi_lm.sh

install_kaldi_lm.sh 也是安裝語(yǔ)言模型。

3. make 完后,在src目錄下:在命令行分別輸入:

./configure

make depend

make

make階段是編譯階段,將下載的包編譯為可執(zhí)行文件,耗時(shí)較長(zhǎng),耐心等待。

ubuntu安裝遇到問(wèn)題最少,centos和macos上安裝都會(huì)出現(xiàn)一些問(wèn)題,得手動(dòng)解決。

遇到過(guò)的error和解決方法:

make過(guò)程中,openfst-1.6.7.tar.gz沒(méi)有解壓完全,因此自動(dòng)又解壓一遍,生成openfst-1.6.7.tar.gz.1,因此要把原openfst-1.6.7.tar.gz刪掉(rm openfst-1.6.7.tar.gz),openfst-1.6.7.tar.gz.1重命名為openfst-1.6.7.tar.gz(mv openfst-1.6.7.tar.gz.1 openfst-1.6.7.tar.gz)。再次make(不需要手動(dòng)解壓)。 sudo make仍出現(xiàn)permission denied造成error。把文件夾的用戶改成使用者。比如我的用戶名叫work,chown -R work kaldi。 如果多次make都遇到error,建議先make clean把編譯過(guò)的全刪掉,再重新裝。

kaldi各文件解釋

/egs:不同語(yǔ)料例子的執(zhí)行腳本文件/tools:存放asr過(guò)程中用到的庫(kù)/src:存放實(shí)際執(zhí)行的c++算法

以aishell為例的ASR過(guò)程

命令行到kaldi路徑下,輸入

cd egs/aishell/s5

首先改cmd的配置:

vim cmd.sh

改為:

export train_cmd=run.pl #"queue.pl --mem 2G"

export decode_cmd="run.pl --mem 4G" #"queue.pl --mem 4G"

export mkgraph_cmd="run.pl --mem 8G" #"queue.pl --mem 8G"

export cuda_cmd="run.pl --gpu 1"

原文件的queue是基于集群的,這里我們用本機(jī)/服務(wù)器跑,因此改為run.sh。

:wq保存后,輸入:

vim run.sh

看見(jiàn)data=/export/a05/xna/data改成想存放語(yǔ)料的路徑,返回后,新建對(duì)應(yīng)的文件夾。之后輸入

./run.sh

就開(kāi)始進(jìn)行asr過(guò)程了。強(qiáng)烈建議逐行運(yùn)行,運(yùn)行當(dāng)前行時(shí),把其他暫時(shí)注釋調(diào),這樣清楚看見(jiàn)每個(gè)階段的過(guò)程。

過(guò)程簡(jiǎn)單說(shuō)來(lái)就是:

語(yǔ)料數(shù)據(jù)準(zhǔn)備 下載語(yǔ)料庫(kù)到本地/服務(wù)器的文件夾數(shù)據(jù)關(guān)系,詞典、語(yǔ)言文件(text, wav.scp, utt2pk, spk2utt)準(zhǔn)備,訓(xùn)練集、測(cè)試集、驗(yàn)證集準(zhǔn)備單音素(或者其他模型)訓(xùn)練和解碼構(gòu)建解碼圖解碼查看結(jié)果

數(shù)據(jù)準(zhǔn)備

1、首先在根目錄下建立路徑:/export/a05/xna/data然后下載數(shù)據(jù)集。這里下載數(shù)據(jù)集要在run.sh前面加sudo命令,這是路徑的緣故。下載數(shù)據(jù)集用到的腳本是local/download_and_untar.sh 需要下載兩個(gè)數(shù)據(jù)文件:data_aishell 和 resource_aishell. 2、數(shù)據(jù)準(zhǔn)備階段運(yùn)行腳本:local/aishell_data_prep.sh 運(yùn)行腳本后會(huì)產(chǎn)生 以下文件:

??? spk2utt: 這里存放的是測(cè)試集好訓(xùn)練集中每個(gè)樣例名稱及其它下面的語(yǔ)音文件名稱。這個(gè)文件在test下面則說(shuō)明是test集的相關(guān)信息,如果在train 文件下則說(shuō)明是train集的相關(guān)信息。文件內(nèi)容如下所示(只展示部分樣例):

??? S0764 BAC009S0764W0121 BAC009S0764W0122 BAC009S0764W0123 BAC009S0764W0124 BAC009S0764W0125 BAC009S0764W0126 BAC009S0764W0127 BAC009S0764W0128 BAC009S0764W0129 BAC009S0764W0130 BAC009S0764W0131 BAC009S0764W0132 BAC009S0764W0133 BAC009S0764W0134 BAC009S0764W0135 BAC009S0764W0136 BAC009S0764W0137 BAC009S0764W0138 BAC009S0764W0139 BAC009S0764W0140 BAC009S0764W0141 BAC009S0764W0142 BAC009S0764W0143 BAC009S0764W0144 BAC009S0764W0145 BAC009S0764W0146 BAC009S0764W0147 BAC009S0764W0148 BAC009S0764W0149 BAC009S0764W0150 BAC009S0764W0151 BAC009S0764W0152 BAC009S0764W0153 BAC009S0764W0154 ??? S0765 BAC009S0765W0121 BAC009S0765W0122 BAC009S0765W0123 BAC009S0765W0124 BAC009S0765W0125 BAC009S0765W0126 BAC009S0765W0127 BAC009S0765W0128 BAC009S0765W0129 BAC009S0765W0130 BAC009S0765W0131 BAC009S0765W0132 BAC009S0765W0133 BAC009S0765W0134 BAC009S0765W0135 BAC009S0765W0136 BAC009S0765W0137 BAC009S0765W0138 BAC009S0765W0139 BAC009S0765W0140 BAC009S0765W0141 BAC009S0765W0142 BAC009S0765W0143 BAC009S0765W0144 BAC009S0765W0145 BAC009S0765W0146 BAC009S0765W0147 BAC009S0765W0148 BAC009S0765W0149 BAC009S0765W0150 BAC009S0765W0151 BAC009S0765W0152 BAC009S0765W0153 BAC009S0765W0154

??? text :這里存放的是訓(xùn)練集和測(cè)試集中語(yǔ)音文本的信息,第一列是語(yǔ)音文件名,第二列是語(yǔ)音文件所對(duì)應(yīng)的說(shuō)話的內(nèi)容,如下所示(只展示部分信息):

??????? BAC009S0764W0121 甚至 出現(xiàn) 交易 幾乎 停滯 的 情況 ??????? BAC009S0764W0122 一二 線 城市 雖然 也 處于 調(diào)整 中 ??????? BAC009S0764W0123 但 因?yàn)?聚集 了 過(guò)多 公共 資源 ??????? BAC009S0764W0124 為了 規(guī)避 三四 線 城市 明顯 過(guò)剩 的 市場(chǎng) 風(fēng)險(xiǎn) ??????? BAC009S0764W0125 標(biāo)桿 房企 必然 調(diào)整 市場(chǎng) 戰(zhàn)略 ??????? BAC009S0764W0126 因此 土地 儲(chǔ)備 至關(guān) 重要 ??????? BAC009S0764W0127 中原 地產(chǎn) 首席 分析 師 張大 偉 說(shuō) ??????? BAC009S0764W0128 一 線 城市 土地 供應(yīng) 量 減少

??? transcripts.txt 這個(gè)文件是text文件的副本 。內(nèi)容跟text文件的內(nèi)容格式一樣

??? utt.list 這個(gè)文件是測(cè)試集和訓(xùn)練集中所有語(yǔ)音文件的名稱

??????? BAC009S0764W0121 ??????? BAC009S0764W0122 ??????? BAC009S0764W0123 ??????? BAC009S0764W0124 ??????? BAC009S0764W0125 ??????? BAC009S0764W0126 ??????? BAC009S0764W0127 ??????? BAC009S0764W0128 ??????? BAC009S0764W0129 ??????? BAC009S0764W0130 ??????? BAC009S0764W0131 ??????? BAC009S0764W0132 ??????? BAC009S0764W0133 ??????? BAC009S0764W0134 ??????? BAC009S0764W0135 ??????? BAC009S0764W0136 ??????? BAC009S0764W0137 ??????? BAC009S0764W0138 ??????? BAC009S0764W0139

??? utt2spk_all 這里放的是語(yǔ)音文件的詳細(xì)信息。第一列是語(yǔ)音文件名稱,第二列是語(yǔ)音文件類別,即說(shuō)話人名稱

??? BAC009S0764W0121 S0764 ??? BAC009S0764W0122 S0764 ??? BAC009S0764W0123 S0764 ??? BAC009S0764W0124 S0764 ??? BAC009S0764W0125 S0764 ??? BAC009S0764W0126 S0764 ??? BAC009S0764W0127 S0764 ??? BAC009S0764W0128 S0764 ??? BAC009S0764W0129 S0764 ??? BAC009S0764W0130 S0764 ??? BAC009S0764W0131 S0764 ??? BAC009S0764W0132 S0764 ??? BAC009S0764W0133 S0764 ??? BAC009S0764W0134 S0764 ??? BAC009S0764W0135 S0764 ??? BAC009S0764W0136 S0764 ??? BAC009S0764W0137 S0764 ??? BAC009S0764W0138 S0764 ??? BAC009S0764W0139 S0764 ??? BAC009S0764W0140 S0764

??? wav.flist 這個(gè)文件中放的是語(yǔ)音文件的詳細(xì)地址和語(yǔ)音文件

??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0360.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0448.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0324.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0133.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0287.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0482.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0456.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0214.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0376.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0157.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0194.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0484.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0490.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0251.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0366.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0210.wav ??????? /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0263.wav

??? wav.scp

??? BAC009S0764W0121 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0360.wav ??? BAC009S0764W0122 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0448.wav ??? BAC009S0764W0123 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0324.wav ??? BAC009S0764W0124 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0133.wav ??? BAC009S0764W0125 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0287.wav ??? BAC009S0764W0126 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0482.wav ??? BAC009S0764W0127 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0456.wav ??? BAC009S0764W0128 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0214.wav ??? BAC009S0764W0129 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0376.wav ??? BAC009S0764W0130 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0157.wav ??? BAC009S0764W0131 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0194.wav ??? BAC009S0764W0132 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0484.wav ??? BAC009S0764W0133 /export/a05/xna/data/data_aishell/wav/test/S0766/BAC009S0766W0490.wav ?

二、特征提取

1、特征提取用到的腳本是:step/make_mfcc.sh 在文件夾exp中會(huì)產(chǎn)生make_mfcc文件夾。在make_mfcc文件夾下會(huì)有test 和 train 文件夾,里面放的是特征提取的日志。正真對(duì)的提取的特征在kaldi-master/egs/aishell/v1/mfcc 中。下面將提取到的特征可視化:

~/kaldi-master/src/featbin/copy-feats ark:/home/gwp/kaldi-master/egs/aishell/v1/mfcc/raw_mfcc_train.2.ark ark,t:- |head

??? 1

運(yùn)行結(jié)果:

??? BAC009S0036W0279 [ ??? 12.55563 -21.31167 11.26867 6.343046 15.55155 4.494844 20.27812 17.99247 18.88603 11.74063 1.810493 -4.666584 -0.2448959 -1.099169 1.787078 8.768214 -0.5345917 0.7129593 -1.881903 -0.184864 ??? 11.32757 -20.03719 16.31762 6.122036 2.568633 0.9016883 4.645835 9.24137 4.62358 7.516443 11.05698 7.462651 1.606389 2.067619 7.471634 4.220415 -7.865553 -4.594973 -2.89533 2.004371 ??? 11.91236 -24.09615 11.07287 10.10023 11.98197 8.601308 12.80181 20.9095 9.971997 -3.990842 -9.981028 -4.873005 12.09514 -0.05607986 -13.64925 2.12143 9.522418 10.41734 1.833998 2.004371 ??? 13.08194 -23.40003 8.919159 8.774164 14.95662 18.35416 18.23913 16.04778 5.812117 -8.620422 -6.109185 -6.524362 4.739332 7.88231 4.0609 10.8672 7.427207 4.352102 0.8205705 0.7026639 ??? 12.14628 -22.70391 9.506536 7.448099 19.12113 25.02716 16.8798 -1.454416 -6.327747 1.68997 9.730171 3.383781 3.17286 5.459522 3.68193 5.619738 -4.90952 1.926007 5.549899 6.6653 ??? 11.91236 -19.61236 13.08912 7.890121 11.98197 16.81424 3.966171 13.13075 9.377729 3.729235 7.266272 22.1378 17.13299 0.987011 -1.784221 -2.556049 0.3034925 -2.488651 0.4827612 0.9393382 ??? 12.84803 -17.27582 15.67192 10.76326 8.27466 12.19446 -10.80211 11.18606 13.53761 4.166221 9.202192 15.51031 1.463983 4.974965 8.608545 2.471261 4.074871 -1.730374 -1.206284 4.040326 ??? 12.20475 -22.00779 10.87708 8.332142 17.93127 11.16785 8.044158 17.99247 18.29176 18.80422 15.70079 9.829611 -8.219662 -8.25178 4.43987 8.768214 -0.1155496 -3.246927 -2.89533 -1.427403 ??? 11.7954 -22.00779 8.13599 7.448099 16.14648 11.68116 6.005165 17.02012 22.45164 9.555708 8.49822 6.042475 1.606389 -2.589295 -4.964538 1.071938 1.141577 2.896445 -8.269815 -1.604908

2、特征提取結(jié)束后還要運(yùn)行腳本sid/compute_vad_decision.sh 進(jìn)行數(shù)據(jù)預(yù)處理,進(jìn)行VAD檢測(cè)。VAD是語(yǔ)音激活檢測(cè)算法,用于判斷什么時(shí)候有語(yǔ)音輸出,什么時(shí)候是靜音狀態(tài)。 3、如果在此數(shù)據(jù)出現(xiàn)異常重復(fù)等都可以運(yùn)行腳本utils/fix_data_dir.sh 進(jìn)行處理。

utils/fix_data_dir.sh data/所有data下的文件都可以進(jìn)行處理。

之后會(huì)在 exp 文件夾下產(chǎn)生一個(gè) mono 的目錄,里面以 .mdl 結(jié)尾的就保存了模型的參數(shù)。使用下面的命令可以查看模型的內(nèi)容。

$ gmm-copy --binary=false exp/mono/0.mdl - | less

構(gòu)建單音素解碼圖:

# Monophone decoding utils/mkgraph.sh data/lang_test exp/mono exp/mono/graph || exit 1;

mkgraph.sh主要生成了HCLG.fst和words.txt這兩個(gè)重要的文件,后續(xù)識(shí)別主要利用了三個(gè)文件,分別是final.mdl、HCLG.fst、words.txt。

解碼:分別針對(duì)開(kāi)發(fā)集和測(cè)試集解碼

steps/decode.sh --cmd "$decode_cmd" --config conf/decode.config --nj 10 \ exp/mono/graph data/dev exp/mono/decode_dev steps/decode.sh --cmd "$decode_cmd" --config conf/decode.config --nj 10 \ exp/mono/graph data/test exp/mono/decode_test

解碼的日志會(huì)保存在 exp/mono/decode_dev/log 和 exp/mono/decode_test/log 里。

Veterbi 對(duì)齊

# Get alignments from monophone system. steps/align_si.sh --cmd "$train_cmd" --nj 10 \ data/train data/lang exp/mono exp/mono_ali || exit 1;

之后就是和訓(xùn)練單音素一樣,進(jìn)行其他模型的訓(xùn)練解碼,生成聲學(xué)模型和語(yǔ)言模型,保存在/exp中。

查看結(jié)果:

輸入下面的命令來(lái)查看結(jié)果

# getting results (see RESULTS file) for x in exp/*/decode_test; do [ -d $x ] && grep WER $x/cer_* | utils/best_wer.sh; done 2>/dev/null

總結(jié):aishell的/s5/run.sh文件運(yùn)行了gmm+hmm hybrid模型以及dnn+hmm hybrid模型。

首先用標(biāo)準(zhǔn)的13維MFCC加上一階和二階導(dǎo)數(shù)訓(xùn)練單音素GMM系統(tǒng),采用倒譜均值歸一化(CMN)來(lái)降低通道效應(yīng)。然后基于具有由LDA和MLLT變換的特征的單音系統(tǒng)構(gòu)造三音GMM系統(tǒng),最后的GMM系統(tǒng)用于為隨后的DNN訓(xùn)練生成狀態(tài)對(duì)齊。基于GMM系統(tǒng)提供的對(duì)齊來(lái)訓(xùn)練DNN系統(tǒng),特征是40維FBank,并且相鄰的幀由11幀窗口(每側(cè)5個(gè)窗口)連接。連接的特征被LDA轉(zhuǎn)換,其中維度降低到200。然后應(yīng)用全局均值和方差歸一化以獲得DNN輸入。DNN架構(gòu)由4個(gè)隱藏層組成,每個(gè)層由1200個(gè)單元組成,輸出層由3386個(gè)單元組成。 基線DNN模型用交叉熵的標(biāo)準(zhǔn)訓(xùn)練。 使用隨機(jī)梯度下降(SGD)算法來(lái)執(zhí)行優(yōu)化。 將迷你批量大小設(shè)定為256,初始學(xué)習(xí)率設(shè)定為0.008。被噪聲干擾的語(yǔ)音可以使用基于深度自動(dòng)編碼器(DAE)的噪聲消除方法。DAE是自動(dòng)編碼器(AE)的一種特殊實(shí)現(xiàn),通過(guò)在模型訓(xùn)練中對(duì)輸入特征引入隨機(jī)破壞。已經(jīng)表明,該模型學(xué)習(xí)低維度特征的能力非常強(qiáng)大,并且可以用于恢復(fù)被噪聲破壞的信號(hào)。在實(shí)踐中,DAE被用作前端管道的特定組件。輸入是11維Fbank特征(在均值歸一化之后),輸出是對(duì)應(yīng)于中心幀的噪聲消除特征。然后對(duì)輸出進(jìn)行LDA變換,提取全局標(biāo)準(zhǔn)化的常規(guī)Fbank特征,然后送到DNN聲學(xué)模型(用純凈語(yǔ)音進(jìn)行訓(xùn)練)。

train_mono.sh 用來(lái)訓(xùn)練單音子隱馬爾科夫模型,一共進(jìn)行40次迭代,每?jī)纱蔚M(jìn)行一次對(duì)齊操作train_deltas.sh 用來(lái)訓(xùn)練與上下文相關(guān)的三音子模型train_lda_mllt.sh 用來(lái)進(jìn)行線性判別分析和最大似然線性轉(zhuǎn)換train_sat.sh 用來(lái)訓(xùn)練發(fā)音人自適應(yīng),基于特征空間最大似然線性回歸nnet3/run_dnn.sh 用nnet3來(lái)訓(xùn)練DNN,包括xent和MPE用chain訓(xùn)練DNN

aishell訓(xùn)練模型的詞錯(cuò)誤率wer和字錯(cuò)誤率cer如下:

%WER 44.23 [ 28499 / 64428, 1821 ins, 4610 del, 22068 sub ] exp/mono/decode_test/wer_13_0.0 %WER 29.67 [ 19113 / 64428, 1567 ins, 2934 del, 14612 sub ] exp/tri1/decode_test/wer_14_0.5 %WER 29.24 [ 18841 / 64428, 1557 ins, 2813 del, 14471 sub ] exp/tri2/decode_test/wer_15_0.5 %WER 27.38 [ 17640 / 64428, 1764 ins, 2267 del, 13609 sub ] exp/tri3a/decode_test/wer_16_0.0 %WER 23.44 [ 15102 / 64428, 1468 ins, 2110 del, 11524 sub ] exp/tri4a/decode_test/wer_15_0.5 %WER 21.76 [ 14017 / 64428, 1383 ins, 1954 del, 10680 sub ] exp/tri5a/decode_test/wer_16_0.5 %WER 17.43 [ 11233 / 64428, 1077 ins, 1675 del, 8481 sub ] exp/nnet3/tdnn_sp/decode_test/wer_16_0.5 %WER 15.96 [ 10281 / 64428, 919 ins, 1672 del, 7690 sub ] exp/chain/tdnn_1a_sp/decode_test/wer_12_0.5 %CER 34.13 [ 35757 / 104765, 783 ins, 3765 del, 31209 sub ] exp/mono/decode_test/cer_11_0.0 %CER 19.56 [ 20496 / 104765, 910 ins, 1436 del, 18150 sub ] exp/tri1/decode_test/cer_13_0.5 %CER 19.16 [ 20073 / 104765, 989 ins, 1211 del, 17873 sub ] exp/tri2/decode_test/cer_13_0.5 %CER 17.24 [ 18060 / 104765, 780 ins, 1024 del, 16256 sub ] exp/tri3a/decode_test/cer_13_0.5 %CER 13.58 [ 14227 / 104765, 640 ins, 716 del, 12871 sub ] exp/tri4a/decode_test/cer_14_0.5 %CER 12.22 [ 12803 / 104765, 668 ins, 565 del, 11570 sub ] exp/tri5a/decode_test/cer_14_0.5 %CER 8.44 [ 8838 / 104765, 331 ins, 510 del, 7997 sub ] exp/nnet3/tdnn_sp/decode_test/cer_14_0.5 %CER 7.37 [ 7722 / 104765, 303 ins, 581 del, 6838 sub ] exp/chain/tdnn_1a_sp/decode_test/cer_11_1.0

在線識(shí)別

在kaldi 的工具集里有好幾個(gè)程序可以用于在線識(shí)別。這些程序都位在src/onlinebin文件夾里,他們是由src/online文件夾里的文件編譯而成(你現(xiàn)在可以用make ext 命令進(jìn)行編譯)。這些程序大多還需要tools文件夾中的portaudio 庫(kù)文件支持,portaudio 庫(kù)文件可以使用tools文件夾中的相應(yīng)腳本文件下載安裝。

# 安裝portaudio yum -y install *alsa* cd kaldi/tools/ ./install_portaudio.sh # 編譯在線識(shí)別工具 cd src/ make ext 或者進(jìn)入kaldi/src/online和kaldi/src/onlinebin,分別make clean ,make就完美解決

服務(wù)器linux系統(tǒng)查看顯卡信息:

root@poweredge:/joanna/kaldi/egs/aishell/online_demo# lspci -vnn | grep VGA -A 12 03:00.0 VGA compatible controller [0300]: Matrox Electronics Systems Ltd. Integrated Matrox G200eW3 Graphics Controller [102b:0536] (rev 04) (prog-if 00 [VGA controller]) ?? ?DeviceName: Embedded Video ?? ?Subsystem: Dell Integrated Matrox G200eW3 Graphics Controller [1028:07e5] ?? ?Flags: bus master, 66MHz, medium devsel, latency 64, IRQ 16, NUMA node 0 ?? ?Memory at 91000000 (32-bit, prefetchable) [size=16M] ?? ?Memory at 92808000 (32-bit, non-prefetchable) [size=16K] ?? ?Memory at 92000000 (32-bit, non-prefetchable) [size=8M] ?? ?Expansion ROM at 000c0000 [virtual] [disabled] [size=128K] ?? ?Capabilities: [dc] Power Management version 3 ?? ?Kernel driver in use: mgag200 ?? ?Kernel modules: mgag200

17:00.0 PCI bridge [0604]: Intel Corporation Sky Lake-E PCI Express Root Port A [8086:2030] (rev 07) (prog-if 00 [Normal decode])

柚子快報(bào)邀請(qǐng)碼778899分享:kaldi做語(yǔ)音識(shí)別

http://yzkb.51969.com/

推薦鏈接

評(píng)論可見(jiàn),查看隱藏內(nèi)容

本文內(nèi)容根據(jù)網(wǎng)絡(luò)資料整理,出于傳遞更多信息之目的,不代表金鑰匙跨境贊同其觀點(diǎn)和立場(chǎng)。

轉(zhuǎn)載請(qǐng)注明,如有侵權(quán),聯(lián)系刪除。

本文鏈接:http://gantiao.com.cn/post/18667125.html

發(fā)布評(píng)論

您暫未設(shè)置收款碼

請(qǐng)?jiān)谥黝}配置——文章設(shè)置里上傳

掃描二維碼手機(jī)訪問(wèn)

文章目錄