comfyUI api 相关现在,我有一个 comfyui 服务器,有了想要画的prompt,我应该怎么用起来? 如果是 stable diffusion,直接 post /prompt 即可,回传的直接就是图片。如果是图生图,POST /sdapi/v1/img2img 传递图片和文本 prompt,返回也是图片。 stable diffusion 的生成能在一次请求之内完成,很有效也很简单,但当然 comfyUI 多出来 2025-03-02
2025年2月2日-qt程序做了什么试着添加了websocket适配,现在可以切换http和websocket。 优化了图片查看器。 感想comfyui的api和我理解的不一样,我以为是有两套,一套http,一套websocket,实际上只有一套。传递大部分信息都是http,实时获取队列状态(以及一些插件,例如服务器状态实时监控)是走websocket。看了一圈,没有一个api是纯走websocket的(也没有必要都走web 2025-02-02
2025年1月9日-qt程序添加功能反思我的这个程序只支持文生图。 正在想要不要添加图生图和反求prompt功能。这样可以发挥webui、comfyui的更多能力。这不会让程序太臃肿。目前的程序并不大。且计算并不是程序本身完成,程序只是调api的。 另外,现在是用json直接存储各种信息。因为json可以直接使用记事本修改,很方便,且用到的数据不会很多,数据之间的关系并不复杂。在想要不要转到使用数据库,例如sqlite。sqlite 2025-01-09
2024年12月29日-qt学习使用qtcreator写了一个简单的qt程序。记录一下。 程序整体的结构在我的程序中,一个窗口,对应一个类,对应一个命名空间,继承QWidget或者QMainWindow类。类中有信号(signals)和槽(slots),按照我的理解:槽是实际执行任务的方法,信号是能跨窗口触发槽的方法。 我的程序主要有mainWindow和starPromptWindow两个窗口,在mainwindow类中实例化 2024-12-29
Glow-TTS阅读Glow-TTS,前置科技点是 tacotron2,tacotron2 的前置科技点是 Waveglow。waveglow 是完全基于流模型的,可以认为tacotron2和glow-tts都是基于它改进而来。 tacotron2 利用 waveglow 实现了更好的效果,但是没有并行,也没有单调对齐(需要手动来对齐,或者需要一个自回归TTS模型作为外部对齐器,例如 FastSpeech)。glow 2024-10-16
每天一点小知识骷髅王.jpg 查看Windows命令对应的可执行文件路径 where(cmd) Get-Command(对于powershell而言) which(类unix shell,例如git bash) reg(直接查询注册表) 查文件拓展名关联程序 assoc ftype 如何将linux命令打印的文本整体右移?通过管道符和某些命令来处理输出的文本...... 使用sed 1echo &quo 2024-10-08
nga机器人后续计划目前基本稳定运行了,后续计划: 后台运行字面意思地挂在后台运行。 图形界面黑框框毕竟还是不好看,操作也不方便,更不直观。 语言用的是python。我是比较熟悉Tkinter、pyqt之类图形库的,这俩用起来也能比较简单地得到想要的效果。 如果移植到C++,会比较费事情(毕竟现成的代码用不了,两个语言的特性还是有差别);何况我不会c++。 插件化?或许可以做成现成框架的某个插件,好处是省下了搓GUI 2024-08-24
nga机器人重写大体思路使用一个 Poster 对象处理数据、请求等问题。 Potser 类中,需要创建两个 session(来自于 request库),用于管理 cookie。两个 session 分别是和 nga 的、和 bilibili 的(数据源)。最大好处是 header、cookie等重复信息不需要重复了,可以通过 session 自动管理。 站点、cookie、api key之类的可以放在环境变量中 2024-07-13
qwen2微调与使用过程lora微调参考 文章 进行微调,得到 .pt 和 .pth 等文件(checkpoint)。 部分代码如下: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546# Transformers加载模型权重tokenizer = AutoTokenizer.from_pretrained 2024-07-06