fastapi 程序移植到 django第一步,创建 django 模板(废话),然后创建 app。 12django-admin startproject project_name .python manage.py startapp app_name 2025-03-07
qt 小程序 开发进展目前的程序虽然实现了功能,但是相当混乱,感觉是因为代码没有按照规范编写,而且大量使用低级低效的语法。 梳理一下程序的逻辑初始化 初始化 ui 包括布局,文本框,菜单栏 加载历史 prompt 实例化 QNetworkAccessManager 等变量 读取本地保存的 api 相关数据 设定状态变量初始值 启动绘图进程需要有状态变量记录当前状态 是 sd 还是 comfyUI 还是别的什么 如 2025-03-03
comfyUI api 相关现在,我有一个 comfyui 服务器,有了想要画的prompt,我应该怎么用起来? 如果是 stable diffusion,直接 post /prompt 即可,回传的直接就是包含了图片链接。如果是图生图,POST /sdapi/v1/img2img 传递图片和文本 prompt,返回也是包含了图片链接。拿到链接之后,只需要 GET,就可以拿到图片。 stable diffusion 的生成能 2025-03-02
2025年2月2日-qt程序做了什么试着添加了websocket适配,现在可以切换http和websocket。 优化了图片查看器。 感想comfyui的api和我理解的不一样,我以为是有两套,一套http,一套websocket,实际上只有一套。传递大部分信息都是http,实时获取队列状态(以及一些插件,例如服务器状态实时监控)是走websocket。看了一圈,没有一个api是纯走websocket的(也没有必要都走web 2025-02-02
2025年1月9日-qt程序添加功能反思我的这个程序只支持文生图。 正在想要不要添加图生图和反求prompt功能。这样可以发挥webui、comfyui的更多能力。这不会让程序太臃肿。目前的程序并不大。且计算并不是程序本身完成,程序只是调api的。 另外,现在是用json直接存储各种信息。因为json可以直接使用记事本修改,很方便,且用到的数据不会很多,数据之间的关系并不复杂。在想要不要转到使用数据库,例如sqlite。sqlite 2025-01-09
2024年12月29日-qt学习使用qtcreator写了一个简单的qt程序。记录一下。 程序整体的结构在我的程序中,一个窗口,对应一个类,对应一个命名空间,继承QWidget或者QMainWindow类。类中有信号(signals)和槽(slots),按照我的理解:槽是实际执行任务的方法,信号是能跨窗口触发槽的方法。 我的程序主要有mainWindow和starPromptWindow两个窗口,在mainwindow类中实例化 2024-12-29
Glow-TTS阅读Glow-TTS,前置科技点是 tacotron2,tacotron2 的前置科技点是 Waveglow。waveglow 是完全基于流模型的,可以认为tacotron2和glow-tts都是基于它改进而来。 tacotron2 利用 waveglow 实现了更好的效果,但是没有并行,也没有单调对齐(需要手动来对齐,或者需要一个自回归TTS模型作为外部对齐器,例如 FastSpeech)。glow 2024-10-16
每天一点小知识骷髅王.jpg 查看Windows命令对应的可执行文件路径 where(cmd) Get-Command(对于powershell而言) which(类unix shell,例如git bash) reg(直接查询注册表) 查文件拓展名关联程序 assoc ftype 如何将linux命令打印的文本整体右移?通过管道符和某些命令来处理输出的文本...... 使用sed 1echo &quo 2024-10-08
nga机器人后续计划目前基本稳定运行了,后续计划: 后台运行字面意思地挂在后台运行。 图形界面黑框框毕竟还是不好看,操作也不方便,更不直观。 语言用的是python。我是比较熟悉Tkinter、pyqt之类图形库的,这俩用起来也能比较简单地得到想要的效果。 如果移植到C++,会比较费事情(毕竟现成的代码用不了,两个语言的特性还是有差别);何况我不会c++。 插件化?或许可以做成现成框架的某个插件,好处是省下了搓GUI 2024-08-24