资讯

本项目是基于Pytorch的语音合成项目,使用的是VITS,VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)是一种语音合成方法,这种时端到端的模型使用起来非常简单,不需要文本对齐等太复杂的流程,直接一键训练和生成,大大降低了学习门槛。
《动手学深度学习》的个人编写版本,虽然在代码上和原书是近乎一致的,但是针对原书解释不佳和其中的Python以及PyTorch的高级用法进行了一定的注释说明。同时在Notebook中也包含有对原书段落的一些高度概括,也就是将代码说明和代码运行放在了一起。