輸入等於輸出 fsa
輸入等於輸出 fsa
完成L的講解
cd /$kaldi_root/egs/wsj/s5
要在這底下執行
utils/prepare_lang.sh
查看lexicon.txt
<SIL> SIL
A EY1
BABY B EY1 B IY0
.....
第0項是詞 後面是音素
因此prepare_lang 要輸入的是'<SIL>'
而非'SIL'
fstdraw --isymbols=phones.txt --osymbols=words.txt L.fst > L.dot
dot -Tjpg L.dot > L.jpg
L_disambig.fst 解決同音字問題
ex 「樹木」與「數目」
B I E S
查看prepare_lang.sh
(B)egin
(E)nd
(I)nternal
(S)ingleton
可以查看 temp/01_learn/lexiconp.txt
/kaldi/tools/openfst/bin/fstdraw --isymbols=phones.txt --osymbols=words.txt L.fst > L.dot
/kaldi/tools/openfst/bin/fstprint --isymbols=phones.txt --osymbols=words.txt L_disambig.fst
軟連結
ln -s $kaldi_root/egs/wsj/s5/utils ./utils
ln -s $kaldi_root/egs/wsj/s5/step ./step
製作 nonsilence_phones.txt
>複製一份phones 將 SIL 刪除
製作optional_silence.txt
> SIL
製作phone.txt
辭典要放在 /local/dict/裡面
從 遞迴/local/dict/lexicon.txt 找全部的音素
聲學特徵 -> H.fst -> 音素
音素 -> L.fst(辭典) -> 詞
詞 -> G.fst -> 詞
音素 -> C.fst -> 音素
檢查文件 目錄
到此目錄下/$kald_root/egs/wsj/s5/
輸入 utils/fix_data_dir 四個檔案的絕對路徑(wav.scp utt2spk spk2utt text)