Stable Diffusion——常用插件安装与测试(一)

前言

随着Stable Diffusion不断演进,越来越多的开发者开始涉足插件开发。尽管网络上存在大量教程,但它们通常零散分布,逐个学习和查找非常耗时,使人感觉每天都在劳累思考。这里总结了Stable Diffusion常用的插件安装与测试方法。

prompt-all-in-one ——提示词翻译补全

插件地址:https://github.com/Physton/sd-webui-prompt-all-in-one

prompt-all-in-one提示词翻译补全是一个功能全面的工具,旨在帮助英文能力有限的用户快速克服语言障碍。其主要功能包括:

  1. 中文输入自动转英文:自动将中文输入转换为英文,方便用户在Stable Diffusion中使用英文提示词。

  2. 自动保存使用描述词:自动保存用户使用过的描述词,方便用户查阅和再次使用。

  3. 描述词历史记录:记录用户使用过的描述词历史,以便用户随时查看和管理。

  4. 快速修改权重:提供快速修改描述词权重的功能,帮助用户调整描述词对生成图像的影响程度。

  5. 收藏常用描述词:允许用户收藏常用的描述词,方便以后再次使用。

  6. 翻译接口多种选择:提供多种翻译接口选择,满足用户不同的翻译需求。

  7. 一键粘贴删除描述词:提供一键粘贴和删除描述词的功能,简化用户操作流程,提高使用效率。

在这里插入图片描述

SixGod——提示词插件

插件地址:https://github.com/thisjam/sd-webui-oldsix-prompt

SixGod提示词插件旨在帮助用户快速生成逼真且富有创意的图像。其主要功能包括:

  1. 清空正向提示词和清空负向提示词:方便用户快速清除已输入的正向和负向提示词。

  2. 提示词起手式:包含人物、服饰、人物发型等各个维度的提示词,帮助用户快速启动创作过程。

  3. 一键清除正向提示词与负向提示词:提供一键清除所有正向和负向提示词的功能,方便用户重新开始或调整创作方向。

  4. 随机灵感关键词:提供随机生成灵感关键词的功能,帮助用户拓展创作思路。

  5. 提示词分类组合随机:随机组合不同类别的提示词,产生多样化的创作灵感。

  6. 动态随机语法:提供动态生成随机语法的功能,进一步丰富创作内容。

在这里插入图片描述

After Detailer——人脸及手部修复插件

插件地址:https://github.com/Bing-su/adetailer
在使用SD绘图的时候,默认的分辨率大小是512*512,这样设置的好处是出图效率高。但是如果涉及到人全身照的时候,经常会出现一个问题:脸部崩。主要原因是在一个比较低的像素画布上,绘制一个全身图,脸部能分配到的像素不够了。
After Detailer是一款功能强大的图像编辑工具,专为修复和编辑图像而设计。它能够自动检测并修复图像中的瑕疵,无论是2D图像还是真实的人脸和手部图像。该工具能够识别面部、人物或手部,并自动为其创建遮罩(mask)并进行重绘。用户可以通过调整参数来改变识别的对象以及识别区域的大小和位置等,以获得更精确的编辑效果。
在这里插入图片描述

Tagger——提示词反推

插件地址:https://github.com/pythongosssComfyUI-WD14-Tagger?tab=readme-ov-file
当得到一张由AI绘制的精美图片,但却不知道生成这幅图片所用的提示词,导致在尝试实践时无从下手。在这种情况下,我们需要想办法获取这些提示词。Tagger是一些可以快速获得提示词的方法。
Tagger提示词反推是一项功能强大的工具,能够从任意图片中提取关键提示词。它有助于用户理解图像的内容,创作创意图像,以及分析图像数据。通过识别和提取图像中的关键特征和元素,Tagger提示词反推可以为用户提供灵感和指导,帮助他们更好地理解图像内容,并在创作过程中获得更多的创意和想法。

Inpaint Anything——局部重绘

插件地址:https://github.com/Uminosachi/sd-webui-inpaint-anything.git
Inpaint Anything 是一款功能强大的图像编辑工具,能够轻松删除和替换图像中的任何元素。它利用人工智能技术自动识别和修复图像中的瑕疵,无需手动创建遮罩。该工具可快速删除图像中不需要的对象或缺陷,修复损坏或受损的图像区域,替换图像中的对象或背景,并创造出各种创意图像效果。

1.安装与下载模型

安装插件并重启之后,可以在导航栏面板中看到Inpaint Anything组件,此时还需要安装SAM模型。SAM 提供三种模型,显存高的下载 sam_vit_h,识别度更精准。显存 8G 左右的下载 sam_vit_l,显存低于 8G 的下载 sam_vit_b。选择对应模型后,点击“下载模型”,下载后的模型会存放在 Inpaint Anything 插件目录中的 models 文件夹内。
在这里插入图片描述
其实IA功能很多,但又比较简单。你可以把插件划分成三个区域。
在这里插入图片描述
首先是分离目标以及调整区,位于左上方。

  1. 将要编辑的图像拖放到输入图像区域。
  2. 点击按钮运行“Segment Anything”,模型将自动识别参考图,并进行元素分离。
  3. 如果图像识别难度较高,可以选择勾选动漫模式,以提高识别度,但这可能会降低蒙版的分离质量。
  4. 填充选项勾选后,你可以修改参考图的模式,通常默认设置即可。

语义分割显示区和选择被分离的蒙版区位于编辑界面的右侧。

  1. 等待几秒钟后,右上方会显示根据模型分离出的不同区块。你可以使用鼠标选择需要的蒙版区域。(由于已经进行了分离,所以只需单击需要重新绘制的区域即可。)
  2. 将鼠标悬停在图像上方,按住 S 键可进入全屏模式,按下 R 键可重置缩放,这有助于更精细地处理图像。
  3. 选择完毕后,点击“创建遮罩”按钮。
  4. 下面两个复选框的功能很容易理解:一个用于反选,另一个用于确定是否包含黑色区域(可能是无法识别的区域)。
  5. 然后,遮罩将以高亮显示的方式出现。
  6. “展开蒙版区域”按钮用于扩充蒙版的大小,这是之前 Segment 工具中也有的功能,可以帮助你向外扩展蒙版,直到满意为止。
  7. 旁边的按钮用于减去手动绘制的区域,以便更精确地定义蒙版。
  8. 最后的按钮用于将手动绘制的区域添加至蒙版中,整个过程相当直观易懂。

在这里插入图片描述

Ultimate SD upscale——图片放大

插件地址:https://github.com/Coyote-A/ultimate-upscale-for-automatic1111.git
Ultimate SD Upscale 是一款功能强大的图像超分辨率工具,它能够将低分辨率的图像提升至高分辨率,并同时减少图像中的噪点和模糊效果。这一工具采用了基于深度学习的超分辨率模型,因此能够提供较高水准的图像处理准确性。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/401616.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【管理咨询宝藏资料23】某资产管理公司薪酬体系设计报告

本报告首发于公号“管理咨询宝藏”,如需阅读完整版报告内容,请查阅公号“管理咨询宝藏”。 【管理咨询宝藏资料23】某资产管理公司薪酬体系设计报告 【格式】PDF版本 【关键词】薪酬设计、绩效优化、管理咨询 【文件核心观点】 - 为某集团设计合理的薪…

干货!这份伦敦银操指南请收好

伦敦银要操得好,投资者要有纯熟的看k线技巧,找到走势图中的支撑和主力地位是很重要的一环。通常当银价1小时、4小时、日线图出现比较大的阳线,那么大阳线的底部、顶部和中部,都是比较有效的支撑,当中又以日线尤为重要。…

Linux内核中并发与竞争的处理方法之原子操作

一. 简介 上一篇文章简单学习了Linux内核提供的原子操作。文章地址如下: Linux内核中并发与竞争的处理方法之原子操作简介-CSDN博客 本文继续学习Linux内核处理并发与竞争的处理方法之一:原子操作。Linux 内核提供了两组原子操作 API 函数&#xff0…

windows下采用 nginx配置websocket支持wss流程

第一步、安装OpenSSL (1)下载OpenSSL软件包 地址:https://slproweb.com/products/Win32OpenSSL.html OpenSSL版本说明: Win64 OpenSSL v1.1.1wLight,安装Win64 OpenSSL v1.1.1w最常用的软件包 Win64 OpenSSL v1.1…

C#_索引器

索引器的作用:令对象可像数组一般被索引 索引器 internal class TestClass {public int[] arr { 1, 2, 3, 4, 5 };public string this[int index] // 前者为返回类型,后者为索引类型// 返回类型代表get函数的返回值类型、set函数的value类型&#xff0…

【深度学习:TACO 数据集】探索 TACO 数据集【模型训练】

【深度学习:TACO 数据集】探索 TACO 数据集【模型训练】 介绍为什么选择以数据为中心的人工智能?上次我们学到了什么?问题关于数据集方法 什么是“对象注释质量”指标?第一次迭代:修复标签错误分析重新贴标签模型再训练…

c++的一些陌生用法记录

c的一些陌生用法记录 1. 完美转发std::forward<decltype(PH1)>(PH1)static的用法 1. 完美转发std::forward<decltype(PH1)>(PH1) static的用法 static函数与普通函数的区别&#xff1a; 用static修饰的函数&#xff0c;本限定在本源码文件中&#xff0c;不能被本源…

MyBatisPlus:PG数组类型自动映射问题

引言: PostGreSQL数据库提供了丰富的数据类型,通过查看官网文档,我们也可以发现,PG也提供了对数组类型的支持。 但是在实际开发中,我们通常是使用MyBatis/MyBatisPlus这种半自动ORM映射框架来实现数据库/表数据基本的增删改查,以及其它操作。那么,问题来了,如何…

大蟒蛇(Python)笔记(总结,摘要,概括)——第10章 文件和异常

目录 10.1 读取文件 10.1.1 读取文件的全部内容 10.1.2 相对文件路径和绝对文件路径 10.1.3 访问文件中的各行 10.1.4 使用文件的内容 10.1.5 包含100万位的大型文件 10.1.6 圆周率中包含你的生日吗 10.2 写入文件 10.2.1 写入一行 10.2.2 写入多行 10.3 异常 10.3.1 处理Ze…

二进制搭建 Kubernetes

实验流程 k8s集群master01&#xff1a;192.168.75.10 kube-apiserver kube-controller-manager kube-scheduler etcd k8s集群master02&#xff1a;192.168.80.20 k8s集群node01&#xff1a;192.168.75.20 kubelet kube-proxy docker k8s集群node02&#xff1a;192.168.…

【Flink经济】Flink 内存管理

面临的问题 目前&#xff0c; 大数据计算引擎主要用 Java 或是基于 JVM 的编程语言实现的&#xff0c;例如 Apache Hadoop、 Apache Spark、 Apache Drill、 Apache Flink 等。 Java 语言的好处在于程序员不需要太关注底层内存资源的管理&#xff0c;但同样会面临一个问题&…

动态规划--线性DP最长上升子序列及其二分优化

1、B站视频链接&#xff1a;E03 线性DP 最长上升子序列_哔哩哔哩_bilibili #include <bits/stdc.h> using namespace std; int n9; int a[101]{0,5,7,1,9,4,6,2,8,3}; int f[101]; //f[i]表示以a[i]为结尾的 //最长上升子序列的长度 int main(){int i,j,ans1;for(int i1…

Spring学习笔记(五)--Spring的AOP模块

一、AOP的底层原理 AOP的底层原理是动态代理&#xff0c;动态代理有两种方式&#xff1a;JDK动态代理和CGLib动态代理&#xff0c;在有接口的实现类时我们通常用JDK的动态代理方式&#xff08;默认情况&#xff09;为类创建代理对象&#xff0c;JDK的动态代理方式可以实现无入…

智慧建工的魔法:数据可视化的引领之光

在智慧建工的时代&#xff0c;数据可视化成为推动建筑行业进步的强大引擎&#xff0c;其作用不可忽视。通过将复杂的建筑数据以直观、清晰的图形展示出来&#xff0c;数据可视化为建筑工程提供了前所未有的便利和创新。 首先&#xff0c;数据可视化在建筑规划和设计阶段发挥关键…

浏览器---浏览器/http相关面试题

1.localStorage和sessionStorage 共同点&#xff1a;二者都是以key-value的键值对方式存储在浏览器端&#xff0c;大小大概在5M。 区别&#xff1a; &#xff08;1&#xff09;数据有效期不同&#xff1a;sessionStorage仅在当前浏览器窗口关闭之前有效&#xff1b;localStorag…

基于springboot+vue的B2B平台的医疗病历交互系统(前后端分离)

博主主页&#xff1a;猫头鹰源码 博主简介&#xff1a;Java领域优质创作者、CSDN博客专家、阿里云专家博主、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战&#xff0c;欢迎高校老师\讲师\同行交流合作 ​主要内容&#xff1a;毕业设计(Javaweb项目|小程序|Pyt…

上海亚商投顾:北向资金净买入超130亿

上海亚商投顾前言&#xff1a;无惧大盘涨跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。 一.市场情绪 指数昨日低开高走&#xff0c;三大股指午后均涨超2%&#xff0c;沪指一度逼近3000点关口&#xff0c;尾盘涨幅…

D3380——应用于无线收发机的宽带 IF IC, 最大 IF 频带为 15MHz. 包含 IF 限 幅放大器、RSSI 和检测器。

D3380是一块具有较大15MHz的高带宽中放集成电路。电路内部集成了一块中放限幅放大器&#xff0c;接收信号强度指示器&#xff0c;检测器。电路主要应用于无绳电话&#xff0c;收音机&#xff0c;遥控器&#xff0c;无线数据传输器等通讯类器件。电路具有低工作电流特性能适应于…

Linux篇:开发工具yum/vim/gcc/g++/Makefile/gdb

一. yum&#xff1a;软件包管理器 什么是软件包&#xff1f; 在Linux 下安装软件 , 一个通常的办法是下载到程序的源代码 , 并进行编译 , 得到可执行程序 . 但是这样太麻烦了, 于是有些人把一些常用的软件提前编译好 , 做成软件包 (可以理解成windows 上的安装程序) 放在…

【MySQL】学习连接查询和案例演示

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​&#x1f4ab;个人格言:“没有罗马,那就自己创造罗马~” #mermaid-svg-KOxr1rwR9cQTlydJ {font-family:"trebuchet ms",verdana,arial,sans-serif;font-siz…
最新文章