662人加入学习
(2人评价)
端到端语音识别-wenet入门

制作完成于2022.4.5,使用wenet,ubuntu18.04

价格 免费

测试:

python3 recognize.py\

 --mode "ctc_greedy_search"\

--config ./wenet_file/model/train.yaml\

--data_type raw\

--test_data ./wenet_file/data.list.100\

--checkpoint ./wenet_file/model/init.pt\

--beam_size 10\

--batch_size 2\

--penalty 0.0\

--dict ./wenet_file/lang.dict\

--ctc_weight 1.0\

--reverse_weight 0.0\

--result_file ./wenet_file/decode/text

 

[展开全文]

data/utils/get_dict.py

import os

with open

[展开全文]
import os
wav_scp_dict={}
#读取文件
with open ("wav.sco",'r',encoding="utf-8")as file:
   #按行去遍历
    for line in file.readline():
        #去掉换行符
        line=line.strip("/n")
        #拿到id
        idx=line.split(" ")[0]
        #拿到路径
        content=line.split(" ")[-1]
        #保存字典
        wav_scp_dict[idx]=content
        pass
     pass

 

[展开全文]

写python

get.text.py

在data_aishell新建python:get_wav_scp.py

终端位置要cd /home/data/wenet/examples/learn/data/data_aishell

import os 

for path in os.listdir("./train"):

   print(path)

pass

[展开全文]