即使在科技领域,Ai也是个全新的物种,研究它有种探索未知世界的恐惧感。
嘿,这是黑猫。随着AI自动驾驶、AI绘画、AI语音、AI大模型等应用的出现,AI开始真切地改变我们的生活,它终究是避不开的。
“AI”到底是什么?许多人会轻飘飘地跟你解释:AI就是人工智能,这个回答正确却无用。
很多人都和我一样,不关心AI的原理,只关心AI应用。大家都很现实,一个技术如果不能带来真正实用的价值,那只不过是空中楼阁,噱头已经见够多了。
大家应该都刷到过AI配音的电影解说,这个男人叫小帅,这个女人叫小美。这些视频,无一例外都是由人工智能配音,语音包来源于Azure文字转语音。
你知道的,微软的文字转语音,是目前语气最接近真人说话,而且商用价格最低廉的AI应用。如果你是个人用户,且使用频率不高,甚至可以白嫖,之前我也写过一篇教程。
当然,微软的文字转语音不够自然,可选的中文语音库就那么几十个。而且它的发音,接近人类,却过于标准,听多了难免觉得厌倦。
最重要的是,随着版本更新到0.98,目前ChatTTS生成的语音,已经非常出色。如果我不告诉你,你甚至都不知道这是AI生成的语音。
下面这段语音,是我用自己写的文章,生成的一段语音,效果非常惊艳。它不仅可以精准传达文字,而且咬字节奏还很有个人特色。
这也就意味着,掌握这门技术,只要你想,你可以模拟任何人声。和往常一样,我们不仅会科普技术,还会给到具体的实操方法。
怎么在Windows电脑上部署ChatTTS语音模型?这个东西还是有门槛的。开发者提供的方法,需要调用大量代码,很难大面积普及。
ChatTTS完全是凭借机能实现的,无需联网。一段30秒的音频生成,需要4GB显存以上的独立才能完成。没的话,就只能调用,速度会慢些——但不是不能用。
只要你的电脑不是太老,运行起来是没问题的。需要用到的软件,工具,我都打包好了,获取方式拉到文章底部。
1)安装FFmpeg
说明:FFmpeg是一个开源的多媒体框架,在ChatTTS中主要用来录制、转换和传输音频,部署前毕竟安装它,否则无法运行。
1,下载我准备的最新压缩包,解压到C盘(系统盘)的Program Files文件夹里,地址是“C:Program Filesffmpeg”。
2)安装ChatTTS
这个版本是ChatTTS 0.98最新版的一键本地部署包,已经全部打包好,解压即可使用。
1,下载ChatTTS压缩包,随便找一个,解压进去。
1,首先在文本框,输入你要转换成语音的文字。注意标点符号要规范,因为它会基于标点符号,判断应该如何发音。
而最新的0.98版本更新了内核,我之前遇到的问题,都修复了不少,现阶段基本可以拿来当生产力工具使用。
唯一的遗憾是,因为声音太逼真,开发者为了规避风险略微降低了音质。但这其实不是问题,用剪映后期处理一下就很不错了——用来制作视频,效果接近完美。大家可以对比一下。
最后是ChatTTS的一键安装包,获取方式:评论区置顶