文字转语音合成开源（语音转文字deepspeech篇）

却尘小筑 2022-12-27 17:49:24

前段时间分享了一篇语音转文字（科大讯飞篇）

今天尝试下开源的deepspeech,deepspeech是基于百度的深度语音论文和谷歌的深度学习框架Tensorflow来实现的。

DeepSpeech is an open source Speech-To-Text engine, using a model trained by machine learning techniques based on Baidu’s Deep Speech research paper. Project DeepSpeech uses Google’s TensorFlow to make the implementation easier.

安装过程比较简单，

1.首先安装python,virtualenv，去python官网下载即可（这里用的3.9版本，3.10版本无法用于deepspeech 0.9版本）

2.创建pyhon的虚拟环境

virtualenv -p python3 $HOME/tmp/deepspeech-venv/

source $HOME/tmp/deepspeech-venv/Scripts/activate

3.安装deepspeech,和下载训练好的模型，及语音文件。

pip3 install deepspeech

curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.pbmm

curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.scorer

curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/audio-0.9.3.tar.gz

tar xvf audio-0.9.3.tar.gz

4.一切准备好后，我们就可以测试语音的识别效果了,如下的音频文件，识别出的结果为：why should one halt on the way，正确率还不错。#教育听我说##我要上 #

文字转语音合成开源（语音转文字deepspeech篇）(1)

展开全文

免责声明：本文仅代表文章作者的个人观点，与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。文章投诉邮箱：anhduc.ph@yahoo.com

秒懂生活

文字转语音合成开源（语音转文字deepspeech篇）

猜您喜欢

优雅旗袍展现女性魅力旗袍穿搭（穿出旗袍的优雅气质）

女性尖锐性湿疣会传染给别人吗（尖锐湿疣传染给家人的概率大不大）

关于香槟的十个冷知识（一篇文章全面了解香槟的类型）

金绿宝石什么颜色的最好（橙黄色系宝石大盘点）

浅粉色月季有哪些（月季粉色和香槟色）

东北常买的米营养价值高（调和米横行市场）

40块十斤的五常大米靠谱吗（调和米横行市场）

热门推荐

排行榜