2023年4月19日

亲爱的日记:

关于vits

前几天发现了autodl这个GPU租用平台,于是充了15块钱,拿来跑vits。

至于原因,我之前一直觉得,自家电脑环境有问题、显存也不够,不足以支撑运算。于是租了三块,每块用多少扣多少钱,一个小时0.78元,可以说是相当便宜。

刚刚回忆了一下,之前监控的内存占用,是不是只有2G多,还有快到离谱(训练一分钟歌曲只需要零点几秒)的速度,又想起还有conda这个环境管理器,于是在自己电脑上试了试。

事实证明,能跑,而且,对显存要求很低。大概只占用了1G多。虽然确实慢了不少,78秒的音频文件,使用了61秒跑完。尽管确实很慢,但比我想象中还是快太多了。

这下不需要忧心忡忡等GPu空闲了。也不需要开着filezilla等着文件传输的完成。更不需要熄灯后用手机热点慢慢传数据了。

但是训练模型,应该还是需要更牛逼的GPU来干。

关于spleeter

这是一个分割音频中人声、伴奏的开源工程,只有11M左右。GUI版本甚至更小,只有10M。

我正在试图解读。

还是关于vits

vits和so-vits-svc有本质区别,虽然我把这俩混为一谈。vits,很小,只有14m;so-vits-svc,更小,小的超乎想象,只有9m。

但是事实上这俩确实是两码事。vits比较大可能是因为自带了测试样品。

so-vits-svc,SoftVC VITS Singing Voice Conversion。

vits,VITS,Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech。

这是VITS的论文。

https://arxiv.org/abs/2106.06103https://petertan303.github.io/img/2106.06103.pdf

关于hexo博客插入pdf在线预览

https://lizhening.github.io/posts/7d20ce7f/

简单概括就是:

  • hexo-pdf插件。通过npm安装,注意是在hexo根目录下执行该语句。npm install --save hexo-pdf
  • {% pdf 链接 %}的形式插入即可,例如{% pdf http://7xov2f.com1.z0.glb.clouddn.com/bash_freshman.pdf %}

那么,我这个就是:

另外注意pdf可以直接放在source文件夹里面。
似乎并不可以……还是放在img文件夹里得了。

好吧,还是有点问题。
现在好了。真不错。

正事

  • [x] py作业
  • [ ] it英语作业
  • [ ] 体测:周四
  • [ ] 数字系统实验报告(纸质)
    • [ ] 实际实验
    • [ ] 仿真实验:延时灯
  • [ ] 交通灯
  • [x] 美术鉴赏作业
  • [ ] 复习
    • [ ] 人工智能基础
    • [ ] 电磁场与波

不是正事

希望可以找时间解决了……

  • [ ] VITS论文阅读
  • [ ] VITS代码阅读
  • [ ] so-vits-svc代码阅读

2023年4月19日
http://petertan303.github.io/2023/04/19/2023年4月19日/
作者
peter?
发布于
2023年4月19日
许可协议