语音合成MocKingBird的安装方法:
安装装备:
python安装,
python环境要求大于等于3.8,安装包下载地址:https://www.python.org/
在进行pyton安装时,需要为python设置环境变量,即将下在“ADD python to PATH”前打勾,
安装,官方下载地址:https://pytorch.org/get-started/locally/,如果电脑没有独显,那么可以使用cpu运行,在打开光网后,选择你要运行的模式:
上图我选择的安装方式是通过gpu运行,运行的环境在windows上,使用pip命令来安装,最后复制这串命令到你的电脑的终端:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117如下所示:
ffmpeg安装,下载地址:http://ffmpeg.org/download.html#build-windows,下载1后将设置环境变量
将ffmpeg下载到本地后,解压得到:
然后为其设置环境变量,右键桌面上的“此电脑”,点击“属性”,
通过高级系统设置进入后台设置:
点击环境变量,进入下一界面
这里选择path,然后进入界面,然后点击新建
将刚刚ffpeg的路径粘贴进来
下载安装MockingBird开源项目:下载地址:https://github.com/babysor/MockingBird
通点击上面官网,进入网页,选择“code”,然后点击“download zip“,
随后解压,即可。、
打开刚才的开源程序包,选择requirements.txt点击进入,这里将
monotonic-align==0.0.0.3改为,1.0.0.0然后保存,
安装visual studio installer,
下载地址:https://visualstudio.microsoft.com/downloads/
将应用安装完毕后,打开页面
这里选择修改,进入页面后在“使用C++的桌面开发”和“通用windows平台生成器”前打勾,然后点击“修改”即可
安装依赖,
pip install -r requirements.txt
待依赖安装完毕后,在输入以下命令
pip install webrtcvad-wheels 来安装webrtcrad-wheels
·,
下载模型
通过网盘链接下载地址:
链接:https://pan.baidu.com/s/1u88jAs_ZhuSr5PhQz07Pyg?pwd=dfds
提取码:dfds
下载一个语音模型,模型下载完毕后把它放置在以下1路径中,
C:UsersXIAXIADownloadsCompressedMockingBird-maindatackptsynthesizer
运行应用程序
随后打开文件MockingBird-main所在位置,然后运行以下命令:python web.py得到下图所示的页面
这里将地址http://192.168.43.90:8080复制下来然后在浏览器中打开得到下图所示页面
在文本内容框中输入你需要合成的语音,在“或上传语音”中选择你需要克隆的声音,
随后点击“synthesize(合成)”按钮,如下图所示:
程序运行后的画面如图所示:
点击左侧的播放按钮,就可以实现语音的合成功能。