ComfyUI
毕设相关
我的毕业设计基本告一段落了,在此记录一下。 是一个缝合了cnn与transformer的cvae,用于生成超透镜矩阵;用fastapi和bootstrap写了一个很简单的网站用来充当GUI。 虽然是我花了五个多月做的毕设,但仔细看看,客观上还是相当粗糙,远远谈不上完美,甚至可以说是草率。那么,我这么多时间都花在了哪里呢? 存在的问题问题有很多很多。 其一是准备不足。模型结构的选择上我犹豫了很长时间
qt 小程序 开发进展
目前的程序虽然实现了功能,但是相当混乱,感觉是因为代码没有按照规范编写,而且大量使用低级低效的语法。 梳理一下程序的逻辑初始化 初始化 ui 包括布局,文本框,菜单栏 加载历史 prompt 实例化 QNetworkAccessManager 等变量 读取本地保存的 api 相关数据 设定状态变量初始值 启动绘图进程需要有状态变量记录当前状态 是 sd 还是 comfyUI 还是别的什么 如
comfyUI api 相关
现在,我有一个 comfyui 服务器,有了想要画的prompt,我应该怎么用起来? 如果是 stable diffusion,直接 post /prompt 即可,回传的直接就是包含了图片链接。如果是图生图,POST /sdapi/v1/img2img 传递图片和文本 prompt,返回也是包含了图片链接。拿到链接之后,只需要 GET,就可以拿到图片。 stable diffusion 的生成能
2025年2月2日-qt程序
做了什么试着添加了websocket适配,现在可以切换http和websocket。 优化了图片查看器。 感想comfyui的api和我理解的不一样,我以为是有两套,一套http,一套websocket,实际上只有一套。传递大部分信息都是http,实时获取队列状态(以及一些插件,例如服务器状态实时监控)是走websocket。看了一圈,没有一个api是纯走websocket的(也没有必要都走web
2025年1月9日-qt程序添加功能
反思我的这个程序只支持文生图。 正在想要不要添加图生图和反求prompt功能。这样可以发挥webui、comfyui的更多能力。这不会让程序太臃肿。目前的程序并不大。且计算并不是程序本身完成,程序只是调api的。 另外,现在是用json直接存储各种信息。因为json可以直接使用记事本修改,很方便,且用到的数据不会很多,数据之间的关系并不复杂。在想要不要转到使用数据库,例如sqlite。sqlite
2024年12月29日-qt学习
使用qtcreator写了一个简单的qt程序。记录一下。 程序整体的结构在我的程序中,一个窗口,对应一个类,对应一个命名空间,继承QWidget或者QMainWindow类。类中有信号(signals)和槽(slots),按照我的理解:槽是实际执行任务的方法,信号是能跨窗口触发槽的方法。 我的程序主要有mainWindow和starPromptWindow两个窗口,在mainwindow类中实例化
Glow-TTS阅读
Glow-TTS,前置科技点是 tacotron2,tacotron2 的前置科技点是 Waveglow。waveglow 是完全基于流模型的,可以认为tacotron2和glow-tts都是基于它改进而来。 tacotron2 利用 waveglow 实现了更好的效果,但是没有并行,也没有单调对齐(需要手动来对齐,或者需要一个自回归TTS模型作为外部对齐器,例如 FastSpeech)。glow
