Skip to content

Latest commit

 

History

History
2751 lines (2224 loc) · 162 KB

README_CN.MD

File metadata and controls

2751 lines (2224 loc) · 162 KB

ComfyUI Layer Style

商业合作请联系email chflame@163.com

一组为ComfyUI设计的节点,可以合成图层达到类似Photoshop的功能。这些节点将PhotoShop的一部分基本功能迁移到ComfyUI,旨在集中工作流程,减少软件切换的频率。

image
*此图工作流(title_example_workflow.json) 在 workflow 目录中.

工作流用示例

在workflow目录下有json格式的工作流示例文件,示范了如何在ComfyUI中使用这些节点。

安装方法

(以ComfyUI官方便携包和秋叶整合包为例,其他ComfyUI环境请修改依赖环境目录)

安装插件

  • 推荐使用 ComfyUI Manager 安装。
  • 或者在CompyUI插件目录(例如“CompyUI\custom_nodes\”)中打开cmd窗口,键入
git clone https://github.com/chflame163/ComfyUI_LayerStyle.git
  • 或者下载解压zip文件,将得到的文件夹复制到 ComfyUI\custom_nodes\

安装依赖包

  • 官方便携包请双击运行插件目录下的install_requirements.bat,秋叶整合包请双击运行插件目录下的install_requirements_aki.bat,然后等待安装完成。

  • 或者在资源管理器ComfyUI\custom_nodes\ComfyUI_LayerStyle 插件目录位置打开cmd窗口,

  官方便携包输入以下命令:

..\..\..\python_embeded\python.exe -s -m pip install .\whl\docopt-0.6.2-py2.py3-none-any.whl
..\..\..\python_embeded\python.exe -s -m pip install .\whl\hydra_core-1.3.2-py3-none-any.whl
..\..\..\python_embeded\python.exe -s -m pip install -r requirements.txt
.\repair_dependency.bat

  秋叶整合包输入以下命令:

..\..\python\python.exe -s -m pip install .\whl\docopt-0.6.2-py2.py3-none-any.whl
..\..\python\python.exe -s -m pip install .\whl\hydra_core-1.3.2-py3-none-any.whl
..\..\python\python.exe -s -m pip install -r requirements.txt
.\repair_dependency.bat
  • 重新打开ComfyUI。

下载模型

国内用户请从百度网盘, 海外用户请从huggingface, 下载全部模型文件并复制到ComfyUI\models文件夹。这个链接提供了本插件需要的所有的模型文件。 或者按各个节点的说明下载模型文件。

常见问题

如果节点不能正常加载,或者使用中出现错误,请在ComfyUI终端窗口查看报错信息。以下是常见的错误及解决方法。

Warning: xxxx.ini not found, use default xxxx..

这个警告信息是找不到ini文件的提示,不影响使用。如果不想看到这些警告,请修改插件目录下所有的 *.ini.example 文件名为*.ini

ModuleNotFoundError: No module named 'psd_tools'

这个错误是psd_tools没有正确安装。

解决方法:

  • 关闭ComfyUI,在插件目录下打开终端窗口,执行以下命令: ../../../python_embeded/python.exe -s -m pip install psd_tools 如果安装psd_tool中出现ModuleNotFoundError: No module named 'docopt'错误,请下载docopt的whl手动安装。在终端执行以下命令: ../../../python_embeded/python.exe -s -m pip install path/docopt-0.6.2-py2.py3-none-any.whl path为whl文件的路径名。

Cannot import name 'guidedFilter' from 'cv2.ximgproc'

这个错误是opencv-contrib-python没有正确安装,或者安装后又安装了其他opencv包导致。

NameError: name 'guidedFilter' is not defined

问题原因同上。

Cannot import name 'VitMatteImageProcessor' from 'transformers'

这个错误是由于transformers 版本过低造成的

insightface 加载缓慢

这是由于protobuf 版本过低造成的。

以上3个依赖包的问题,请双击运行插件目录下的repair_dependency.bat(官方便携包)或者repair_dependency_aki.bat(秋叶整合包)自动修复。

onnxruntime::python::CreateExecutionProviderInstance CUDA_PATH is set but CUDA wasn't able to be loaded. Please install the correct version of CUDA and cuDNN as mentioned in the GPU requirements page

解决方法: 请重新安装onnxruntime依赖包

Error loading model xxx: We couldn't connect to huggingface.co ...

请检查网络环境。如果在中国不能正常访问huggingface.co,请尝试修改huggingface_hub包强制使用hf_mirror镜像。

  • huggingface_hub包的目录(通常在虚拟环境内的Lib/site-packages/huggingface_hub)中找到constants.py, 在import os之后增加一行
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

ValueError: Trimap did not contain foreground values (xxxx...)

这个错误是由于使用PyMatting方法处理遮罩边缘时,遮罩面积过大或者过小引起的。

解决方法:

  • 请调整参数,改变遮罩有效面积。或者换用其他的方法处理边缘。

Requests.exceptions.ProxyError: HTTPSConnectionPool(xxxx...)

出现这个错误,请检查网络环境。

UnboundLocalError: local variable 'clip_processor' referenced before assignment

UnboundLocalError: local variable 'text_model' referenced before assignment

如果执行JoyCaption2节点时出现这个报错,同时已确定模型文件已放在正确的目录,请检查transformers依赖包版本至少在4.43.2以上。 如果transformers依赖包版本大于等于4.45.0, 并同时有报错信息:

Error loading models: De️️scriptors cannot be created directly.                                                                                           
If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.                                
......

请尝试降级protobuf依赖包到3.20.3, 或者设置环境变量:PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python

如何找到本节点组

  • 在ComfyUI画布点击右键 - Add Node, 找到 "😺dzNodes"。
    image

  • 或者在ComfyUI画布双击, 在搜索框输入"layer"。Florence2Image2Prompt image

更新说明

**如果本插件更新后出现依赖包错误,请双击运行插件目录下的install_requirements.bat(官方便携包),或 install_requirements_aki.bat(秋叶整合包) 重新安装依赖包。

节点说明

节点按照功能分为5组:LayerStyle, LayerColor, LayerMask, LayerUtility和LayerFilter。

  • LayerStyle节点组提供仿照Adobe Photoshop的图层样式。 image
  • LayerColor节点组提供调整颜色功能。 image
  • LayerMask节点组提供Mask辅助工具。 image
  • LayerUtility节点组提供图层合成工具和工作流相关的辅助节点。 image
  • LayerFilter节点组提供图像效果滤镜。 image

image
image

生成阴影。 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩,阴影按此生成。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 阴影的混合模式。
  • opacity: 阴影的不透明度。
  • distance_x: 阴影的水平方向偏移量。
  • distance_y: 阴影的垂直方向偏移量。
  • grow: 阴影扩张幅度。
  • blur:阴影模糊程度。
  • shadow_color4: 阴影颜色。
  • 节点注解

生成外发光。 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩,外发光按此生成。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 发光的混合模式。
  • opacity: 发光的不透明度。
  • brightness: 发光亮度。
  • glow_range: 发光范围。
  • blur:发光模糊程度。
  • light_color4: 发光中心颜色。
  • glow_colo4: 辉光外围颜色。
  • 节点注解

生成内阴影。 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩,阴影按此生成。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 阴影的混合模式。
  • opacity: 阴影的不透明度。
  • distance_x: 阴影的水平方向偏移量。
  • distance_y: 阴影的垂直方向偏移量。
  • grow: 阴影扩张幅度。
  • blur:阴影模糊程度。
  • shadow_color4: 阴影颜色。
  • 节点注解

生成内发光。 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩,发光按此生成。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 发光的混合模式。
  • opacity: 发光的不透明度。
  • brightness: 发光亮度。
  • glow_range: 发光范围。
  • blur:发光模糊程度。
  • light_color4: 发光中心颜色。
  • glow_colo4: 辉光外围颜色。
  • 节点注解

生成描边。 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩,描边按此生成。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 描边的混合模式。
  • opacity: 不透明度。
  • stroke_grow: 描边扩张/收缩幅度,正值是扩张,负值是收缩。
  • stroke_width: 描边宽度。
  • blur: 描边模糊。
  • stroke_color4: 描边颜色。
  • 节点注解

渐变覆盖 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 描边的混合模式。
  • opacity: 不透明度。
  • start_color: 渐变开始端的颜色。
  • start_alpha: 渐变开始端的透明度。
  • end_color: 渐变结束端的颜色。
  • end_alpha: 渐变结束端的透明度。
  • angle: 渐变旋转角度。
  • 节点注解

颜色覆盖 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 描边的混合模式。
  • opacity: 不透明度。
  • color: 覆盖的颜色。
  • 节点注解

image
image

LUT Apply

将LUT应用到图像。仅支持.cube格式的LUT文件。 image

节点选项说明:
image

  • LUT*: 这里列出了LUT文件夹中可用的.cube文件列表,选中的LUT文件将被应用到图像。
  • color_space: 普通图片请选择linear, log色彩空间的图片请选择log。
  • strength: 范围0~100, LUT应用强度。数值越大,与原图的差别越大, 数值越小,越接近原图。

*LUT文件夹在resource_dir.ini中定义,这个文件位于插件根目录下, 默认名字是resource_dir.ini.example, 初次使用这个文件需将文件后缀改为.ini。 用文本编辑软件打开,找到“LUT_dir=”开头的这一行,编辑“=”之后为自定义文件夹路径名。这个文件夹里面所有的.cube文件将在ComfyUI初始化时被收集并显示在节点的列表中。 支持定义多个文件夹,之间用逗号,分号或者空格分隔。 如果ini中设定的文件夹无效,将启用插件自带的LUT文件夹。

自动调整图片的亮度,对比度和白平衡。提供一些手动调整选项以弥补自动调整的不足。 image

节点选项说明:
image

  • strength: 调整的强度。数值越大,与原图的差别越大。
  • brightness: 亮度手动调整。
  • contrast: 对比度手动调整。
  • saturation: 色彩饱和度手动调整。
  • red: 红色通道手动调整。
  • green: 绿色通道手动调整。
  • blue: 蓝色通道手动调整。

在AutoAdjust基础上增加遮罩输入, 仅计算遮罩内的内容进行自动调色。增加多种自动调整模式。 image

在AutoAdjust基础上进行了如下改变:
image

  • mask:可选遮罩输入。
  • mode: 自动调整模式。"RGB"按RGB三个通道自动调整,"lum + sat"按亮度和饱和度自动调整,"luminance"按亮度自动调整,"saturation"按饱和度自动调整, "mono"按灰度自动调整并输出单色。

将过暗或过亮的图片自动调整到适中的亮度,支持遮罩输入。有遮罩输入时仅以遮罩部分的内容作为自动亮度的数据来源。输出仍然是整个调整后的图像。 image

节点选项说明:
image

  • strength: 自动调整亮度的强度。数值越大,越偏向中间值,与原图的差别越大。
  • saturation: 色彩饱和度。亮度改变通常会导致色彩饱和度发生变化,可在此适当调整补偿。

自动调整图片色调,使之与参考图片相似。 image

节点选项说明:
image

  • opacity: 图像调整色调之后的不透明度。

改变图像的曝光。 image

节点选项说明:

  • exposure: 曝光值。更高的数值表示更亮的曝光。

Color of Shadow & Highlight

调整图像暗部和亮部的颜色。 image

节点选项说明:
image

  • image: 图像输入。
  • mask: 可选输入。如果有输入,将只调整遮罩范围内的颜色。
  • shadow_brightness: 暗部的亮度。
  • shadow_saturation: 暗部的色彩饱和度。
  • shadow_hue: 暗部的色相。
  • shadow_level_offset: 暗部取值的偏移量,更大的数值使更多靠近明亮的区域纳入暗部。
  • shadow_range: 暗部的过渡范围。
  • highlight_brightness: 亮部的亮度。
  • highlight_saturation: 亮部的色彩饱和度。
  • highlight_hue: 亮部的色相。
  • highlight_level_offset: 亮部取值的偏移量,更小的数值使更多靠近阴暗的区域纳入亮部。
  • highlight_range: 亮部的过渡范围。

Color of Shadow HighlightV2

Color of Shadow & Highlight 节点的复制品,去掉了节点名称中的"&"字符以避免ComfyUI工作流解析错误。

image
改变图像的色温。

节点选项说明:
image

  • temperature: 色温值。范围在-100到100之间。值越高,色温越高(偏蓝);越低,色温越低(偏黄)。

image
改变图像的色彩平衡。

节点选项说明:
image

  • cyan_red: 青-红平衡。负值为偏青,正值为偏红。
  • magenta_green: 品-绿平衡。负值为偏品,正值为偏绿。
  • yellow_blue: 黄-蓝平衡。负值为偏黄,正值为偏蓝。

image
改变图像色阶。

节点选项说明:
image

  • channel: 选择要调整的通道。有RGB, red, green, blue可供选择。
  • black_point*: 图像输入黑点值。取值范围0-255, 默认值0。
  • white_point*: 图像输入白点值。取值范围0-255, 默认值255。
  • gray_point: 图像输入灰点值。取值范围0.01-9.99, 默认1。
  • output_black_point*: 图像输出黑点值。取值范围0-255, 默认值0。
  • output_white_point*: 图像输出黑点值。取值范围0-255, 默认值255。

*如果 black_point 或 output_black_point 数值大于 white_point 或 output_white_point,则两个数值将交换,较大的数值作为white_point使用,较小的数值作为black_point使用。

改变图像的Gamma值。

节点选项说明:
image

  • gamma: 图像的Gamma值。

Brightness & Contrast

改变图像的亮度、对比度和饱和度。

节点选项说明:
image

  • brightness: 图像的亮度。
  • contrast: 图像的对比度。
  • saturation: 图像的色彩饱和度。

Brightness & Contrast节点的复制品,去掉了节点名称中的"&"字符以避免ComfyUI工作流解析错误。

对图像的RGB各通道进行调整。

节点选项说明:
image

  • R: 图像的R通道。
  • G: 图像的G通道。
  • B: 图像的B通道。

对图像的YUV各通道进行调整。

节点选项说明:
image

  • Y: 图像的Y通道。
  • U: 图像的U通道。
  • V: 图像的V通道。

对图像的LAB各通道进行调整。

节点选项说明:
image

  • L: 图像的L通道。
  • A: 图像的A通道。
  • B: 图像的B通道。

对图像的HSV各通道进行调整。

节点选项说明:
image

  • H: 图像的H通道。
  • S: 图像的S通道。
  • V: 图像的V通道。

image

用于合成图层,允许在背景图片上合成与之不同尺寸的图层图片,并且设置位置和变换。提供多种混合模式供选择,可设置透明度。

节点提供了图层变换方法和抗锯齿选项。有助于提高合成画质。

节点提供了mask输出可用于后续工作流。 image

节点选项说明:
image

  • background_image: 背景图像。
  • layer_image5: 用于合成的层图像。
  • layer_mask2,5: 层图像的遮罩。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 图层混合模式。
  • opacity: 不透明度。
  • x_percent: 图层在背景图上的水平位置,用百分比表示,最左侧是0,最右侧是100,可以是小于0或者超过100,那表示图层有部分内容在画面之外。
  • y_percent: 图层在背景图上的垂直位置,用百分比表示,最上侧是0,最下侧是100。例如设置为50表示垂直居中,20是偏上,80则是偏下。
  • mirror: 镜像翻转。提供2种翻转模式, 水平翻转和垂直翻转。
  • scale: 图层放大倍数,1.0 表示原大。
  • aspect_ratio: 图层长宽比。1.0 是原始比例,大于此值表示拉长,小于此值表示压扁。
  • rotate: 图层旋转度数。
  • transform_method: 用于图层放大和旋转的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。不同的采样方法会影响合成的画质和画面处理时间。
  • anti_aliasing: 抗锯齿,范围从0-16,数值越大,锯齿越不明显。过高的数值将显著降低节点的处理速度。
  • 节点注解

将图片按照mask范围裁切,可设置四周边框保留大小。这个节点与RestoreCropBoxImageScaleRestore配合使用,可以对图片的局部进行裁切,放大修改后贴回原处。 image

节点选项说明:
image

  • image5: 输入的图像。
  • mask_for_crop5: image的遮罩,将自动按照遮罩范围进行裁切。
  • invert_mask: 是否反转遮罩。
  • detect: 探测方法,min_bounding_rect是大块形状最小外接矩形, max_inscribed_rect是大块形状最大内接矩形, mask_area是遮罩像素有效区域。
  • top_reserve: 裁切顶端保留大小。
  • bottom_reserve: 裁切底部保留大小。
  • left_reserve: 裁切左侧保留大小。
  • right_reserve: 裁切右侧保留大小。
  • 节点注解

输出:

  • croped_image: 裁切后的图片。
  • croped_mask: 裁切后的遮罩。
  • crop_box: 裁切box数据,在RestoreCropBox节点恢复时使用。
  • box_preview: 裁切位置预览图,红色是探测到的范围,绿色是加上保留边框后裁切的范围。

CropByMask的V2升级版。支持crop_box输入,方便裁切相同尺寸的图层。

在CropByMask基础上做了如下改变: image

  • mask_for_crop更名为mask
  • 增加crop_box可选输入,如果这里有输入将忽略遮罩探测,直接使用此数据裁切。
  • 增加round_to_multiple选项,使裁切边长倍数取整。例如设置为8,宽和高将强制设置为8的倍数。

将被CropByMask裁切后的图片恢复到原图。

节点选项说明:
image

  • background_image: 裁切前的原图。
  • croped_image5: 裁切后的图片。如果中间经过放大处理,恢复前需将尺寸还原。
  • croped_mask2,5: 裁切后的遮罩。
  • crop_box: 裁切时的box数据。
  • invert_mask: 是否反转遮罩。
  • 节点注解

corp_box 解析为 x , y , width , heightimage

图像缩放。此节点成对使用时,在第二个节点可自动还原图像到原始大小。 image

节点选项说明:
image

  • image5: 输入的图像。
  • mask2,5: 图像的遮罩。
  • original_size: 可选输入,用于恢复图片到原始大小。
  • scale: 缩放比例。当有original_size输入,或者scale_by_longest_side设置为True时,此项设置将被忽略。
  • scale_by_longest_side: 允许按长边尺寸缩放。
  • longest_side: scale_by_longest_side被设置为True时,此项将作为是图像长边的长度。当有original_size输入时,此项设置将被忽略。
  • 节点注解

输出:

  • image: 缩放后的图像。
  • mask: 如果有mask输入,将输出缩放后的mask。
  • original_size: 图像的原始大小数据,用于后续节点进行恢复。
  • width: 输出图片的宽。
  • height: 输出图片的高。

ImageScaleRestore的V2升级版。

节点选项说明:
image
在ImageScaleRestore基础上做了如下改变:

  • scale_by: 允许按长边、短边、宽度、高度或总像素指定尺寸缩放。此处选项设为by_scale时使用scale值,其他选项时使用scale_by_lengtt值。
  • scale_by_length: 这里的数值作为scale_by指定边的长度。

将图像或遮罩缩放到参考图像(或遮罩)的大小。 image

节点选项说明:
image

  • scale_as*: 参考大小。可以是图像image,也可以是遮罩mask。
  • image: 待缩放的图像。此选项为可选输入,如果没有输入将输出纯黑图片。
  • mask: 待缩放的遮罩。此选项为可选输入,如果没有输入将输出纯黑遮罩。
  • fit: 缩放画幅宽高比模式。当原图与缩放尺寸画幅宽高比例不一致时,有3种模式可以选择, letterbox模式保留完整的画幅,空白处用黑色补足;crop模式保留完整的短边,长边超出部分将被切除;fill模式不保持画幅比例,宽高各自填满画面。
  • method: 缩放的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。

*仅限输入image和mask, 如果强制接入其他类型输入,将导致节点错误。

输出:

  • image: 如果有image输入,将输出缩放后的图像。
  • mask: 如果有mask输入,将输出缩放后的遮罩。
  • original_size: 图像的原始大小数据,用于后续节点进行恢复。
  • width: 输出图片的宽。
  • height: 输出图片的高。

将图像或遮罩按宽高比缩放。可设置将缩放后的尺寸按8或者16的倍数取整,可按长边尺寸缩放。 image

节点选项说明:
image

  • aspect_ratio: 宽高比。此处提供了几个常见画幅比例。也可选"original"保持原图比例或者"custom"自定义比例。
  • proportional_width: 比例宽。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • proportional_height: 比例高。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • fit: 缩放画幅宽高比模式。有3种模式可以选择, letterbox模式保留完整的画幅,空白处用黑色补足;crop模式保留完整的短边,长边超出部分将被切除;fill模式不保持画幅比例,宽高各自填满画面。
  • method: 缩放的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。
  • round_to_multiple: 倍数取整。例如设置为8,宽和高将强制设置为8的倍数。
  • scale_by_longest_side: 允许按长边尺寸缩放。
  • longest_side: scale_by_longest_side被设置为True时,此项将作为是图像长边的长度。

输出:

  • image: 如果有image输入,将输出缩放后的图像。
  • mask: 如果有mask输入,将输出缩放后的遮罩。
  • original_size: 图像的原始大小数据,用于后续节点进行恢复。
  • width: 输出图片的宽。
  • height: 输出图片的高。

ImageScaleByAspectRatio的V2升级版

节点选项说明:
image
在ImageScaleByAspectRatio基础上做了如下改变:

  • scale_to_side: 允许按长边、短边、宽度、高度或总像素指定尺寸缩放。
  • scale_to_length: 这里的数值作为scale_to_side指定边的长度, 或者总像素数量(kilo pixels)。
  • background_color4: 背景色。

根据图片反推提示词。这个节点是ComfyUI_VLM_nodes中的UForm-Gen2 Qwen Node节点的重新封装,感谢原作者。 请从huggingface或者百度网盘下载模型到ComfyUI/models/LLavacheckpoints/files_for_uform_gen2_qwen文件夹。

image

节点选项说明:

  • question: 对UForm-Gen-QWen模型的提示词。

使用Llama 3.2 vision 模型进行本地推理。可以用于生成提示词。本节点部分代码来自ComfyUI-PixtralLlamaMolmoVision,感谢原作者。 运行这个节点需要transformers升级到4.45.0以上。 请从 百度网盘huggingface/SeanScripts下载整个文件夹,并复制到ComfyUI/models/LLM。

image

节点选项说明:
image

  • image: 图片输入。
  • model: 目前仅有"Llama-3.2-11B-Vision-Instruct-nf4"这一个模型可用。
  • system_prompt: LLM模型的系统提示词。
  • user_prompt: LLM模型的用户提示词。
  • max_new_tokens: LLM的max_new_tokens参数。
  • do_sample: LLM的do_sample参数。
  • top-p: LLM的top_p参数。
  • top_k: LLM的top_k参数。
  • stop_strings: 截止字符串。
  • seed: 随机种子。
  • control_after_generate: 种子变化选项。
  • include_prompt_in_output: 输出是否包含提示词。
  • cache_model: 是否缓存模型。

使用JoyCaption-alpha-two模型生成提示词。本节点是 https://huggingface.co/John6666/joy-caption-alpha-two-cli-mod 在ComfyUI中的实现,感谢原作者。 请从 百度网盘 以及 百度网盘 , 或者 huggingface/Orenguteng 以及 huggingface/unsloth 下载整个文件夹,并复制到ComfyUI/models/LLM, 从 百度网盘 或者 huggingface/google 下载整个文件夹,并复制到ComfyUI/models/clip, 从 百度网盘 或者 huggingface/John6666下载 cgrkzexw-599808 文件夹,并复制到ComfyUI/models/Joy_caption。 image

节点选项说明:
image

  • image: 图片输入。
  • extra_options: extra_options参数输入。
  • llm_model: 目前有 Orenguteng/Llama-3.1-8B-Lexi-Uncensored-V2 和 unsloth/Meta-Llama-3.1-8B-Instruct 两种LLM模型可选择。
  • device: 模型加载设备。目前仅支持cuda。
  • dtype: 模型加载精度,有nf4 和 bf16 两个选项。
  • vlm_lora: 是否加载text_model。
  • caption_type: caption类型选项, 包括"Descriptive"(正式语气描述), "Descriptive (Informal)"(非正式语气描述), "Training Prompt"(SD训练描述), "MidJourney"(MJ风格描述), "Booru tag list"(标签列表), "Booru-like tag list"(类标签列表), "Art Critic"(艺术评论), "Product Listing"(产品列表), "Social Media Post"(社交媒体风格)。
  • caption_length: 描述长度。
  • user_prompt: LLM模型的用户提示词。如果这里有内容将覆盖caption_type和extra_options的所有设置。
  • max_new_tokens: LLM的max_new_tokens参数。
  • do_sample: LLM的do_sample参数。
  • top-p: LLM的top_p参数。
  • temperature: LLM的temperature参数。
  • cache_model: 是否缓存模型。

JoyCaption2 的分离式节点,将模型加载与推理分离,使用多个JoyCaption2节点时可共用模型提高效率。

节点选项说明:
image

  • image: 图片输入。
  • joy2_model: JoyCaption模型输入。
  • extra_options: extra_options参数输入。
  • caption_type: caption类型选项, 包括"Descriptive"(正式语气描述), "Descriptive (Informal)"(非正式语气描述), "Training Prompt"(SD训练描述), "MidJourney"(MJ风格描述), "Booru tag list"(标签列表), "Booru-like tag list"(类标签列表), "Art Critic"(艺术评论), "Product Listing"(产品列表), "Social Media Post"(社交媒体风格)。
  • caption_length: 描述长度。
  • user_prompt: LLM模型的用户提示词。如果这里有内容将覆盖caption_type和extra_options的所有设置。
  • max_new_tokens: LLM的max_new_tokens参数。
  • do_sample: LLM的do_sample参数。
  • top-p: LLM的top_p参数。
  • temperature: LLM的temperature参数。

JoyCaption2 的模型加载节点,与JoyCaption2Split配合使用。

节点选项说明:
image

  • llm_model: 目前有 Orenguteng/Llama-3.1-8B-Lexi-Uncensored-V2 和 unsloth/Meta-Llama-3.1-8B-Instruct 两种LLM模型可选择。
  • device: 模型加载设备。目前仅支持cuda。
  • dtype: 模型加载精度,有nf4 和 bf16 两个选项。
  • vlm_lora: 是否加载text_model。

JoyCaption2的extra_options参数节点。

节点选项说明:
image

  • refer_character_name: 如果图像中有人物/角色,必须将其称为{name}
  • exclude_people_info: 不要包含有关无法更改的人物/角色的信息(例如种族、性别等),但仍包含可更改的属性(例如发型)。
  • include_lighting: 包括照明信息。
  • include_camera_angle: 包括摄影机角度信息。
  • include_watermark: 包括是否有水印信息。
  • include_JPEG_artifacts: 包括是否存在 JPEG 伪影信息。
  • include_exif: 如果是照片,包含相机的信息以及光圈、快门速度、ISO等信息。
  • exclude_sexual: 不要包含任何与性有关的内容,保持PG。
  • exclude_image_resolution: 不要包含图像分辨率信息。
  • include_aesthetic_quality: 包含图像美学(从低到非常高)信息。
  • include_composition_style: 包括有关图像构图风格的信息,例如引导线、三分法或对称性。
  • exclude_text: 不要包含任何文字信息。
  • specify_depth_field: 包含景深以及背景模糊信息。
  • specify_lighting_sources: 如果可以判别人造或自然光源,则包含在内。
  • do_not_use_ambiguous_language: 不要使用任何含糊不清的言辞。
  • include_nsfw: 包含NSFW或性暗示信息。
  • only_describe_most_important_elements: 只描述最重要的元素。
  • character_name: 如果选择了refer_character_name,则使用此处的名字。

使用Micrisoft Phi 3.5文字及视觉模型进行本地推理。可以用于生成提示词,加工提示词或者反推图片的提示词。运行这个模型需要至少16GB的显存。 请从百度网盘 或者 huggingface.co/microsoft/Phi-3.5-vision-instructhuggingface.co/microsoft/Phi-3.5-mini-instruct 下载全部模型文件并放到 ComfyUI\models\LLM 文件夹。 image

节点选项说明:
image

  • image: 可选输入。输入的图片将作为Phi-3.5-vision-instruct的输入。
  • model: 可选择加载的Phi-3.5-vision-instruct模型,或者Phi-3.5-mini-instruct模型。默认值auto将根据是否有图片输入自动加载对应模型。
  • device: 模型加载设备。支持cpu和cuda。
  • dtype: 模型加载精度,有fp16、bf16和fp32三个选项。
  • cache_model: 是否缓存模型。
  • system_prompt: Phi-3.5-mini-instruct的系统提示词。
  • user_prompt: LLM模型的用户提示词。
  • do_sample: LLM的do_sample参数,默认为True。
  • temperature: LLM的temperature参数,默认为0.5。
  • max_new_tokens: LLM的max_new_tokens参数,默认为512。

用于生成SD文本到图片提示词的UserPrompt预设。

节点选项说明:
image

  • template: 提示词模板。目前仅有“SD txt2img prompt”可用。
  • describe: 提示词描述。在这里输入简单的描述。
  • limit_word: 输出的提示词最大长度限制。例如200即表示输出文本将被限制在200个词以内。

用于参考输入的内容生成SD文本到图片提示词的UserPrompt预设。

节点选项说明:
image

  • reference_text: 参考文本输入。通常是图片的风格描述。
  • template: 提示词模板。目前仅有“SD txt2img prompt”可用。
  • describe: 提示词描述。在这里输入简单的描述。
  • limit_word: 输出的提示词最大长度限制。例如200即表示输出文本将被限制在200个词以内。

用于将文本中的某个关键词替换为不同内容的UserPrompt预设。这不仅是简单的替换,还可以根据提示词上下文进行文字逻辑梳理以达到输出内容的合理性。

节点选项说明:
image

  • orig_prompt: 原始提示词输入。
  • template: 提示词模板。目前仅有“prompt replace word”可用。
  • exclude_word: 需要排除的关键词。
  • replace_with_word: 替换exclude_word的关键词。

根据图片反推提示词,可以设置替换词。这个节点目前使用Google Gemini API作为后端服务,请确保网络环境可以正常使用Gemini。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。 image

节点选项说明:
image

  • api: 使用的Api。有"gemini-1.5-flash"和"google-gemini"两个选项。
  • token_limit: 生成提示词的最大token限制。
  • exclude_word: 需要排除的关键词。
  • replace_with_word: 替换exclude_word的关键词。

输入简单的提示词,输出经过润色的提示词,支持输入图片作为参考,支持中文输入。这个节点目前使用Google Gemini API作为后端服务,请确保网络环境可以正常使用Gemini。 请在Google AI Studio申请你的API key, 并将其填到api_key.ini, 这个文件位于插件根目录下, 默认名字是api_key.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,在google_api_key=后面填入你的API key并保存。 image

节点选项说明:
image

  • image: 可选项,输入图像作为提示词参考。
  • api: 使用的Api。有"gemini-1.5-flash"和"google-gemini"两个选项。
  • token_limit: 生成提示词的最大token限制。
  • discribe: 在这里输入简单的描述。支持中文。

使用florence2模型反推提示词。本节点部分的代码来自yiwangsimple/florence_dw,感谢原作者。 *首次使用时将自动下载模型,请在可以访问huggingface.co的网络环境下使用。您也可以从百度网盘下载模型文件并复制到ComfyUI/models/florence2文件夹。

image

节点选项说明: image

  • florence2_model: Florence2模型输入。
  • image: 图片输入。
  • task: 选择florence2任务。
  • text_input: florence2任务文本输入。
  • max_new_tokens: 生成文本的最大token数量。
  • num_beams: 生成文本的beam search数量。
  • do_sample: 是否使用文本生成采样。
  • fill_mask: 是否使用文本标记掩码填充。

使用blip-vqa模型进行视觉问答。本节点的部分代码参考自celoron/ComfyUI-VisualQueryTemplate,感谢原作者。
*请从百度网盘 或者 huggingface.co/Salesforce/blip-vqa-capfilt-largehuggingface.co/Salesforce/blip-vqa-base 下载全部模型文件并放到 ComfyUI\models\VQA文件夹。

image

节点选项说明: image

  • image: 图片输入。
  • vqa_model: vqa模型输入。从LoadVQAModel节点加载模型。
  • question: 任务文本输入。单个的问题用大括号"{}"包围,该问题的答案将在原位置替换问题文本输出。可以在一次问答中使用多个问题分别用大括号定义。 例如, 对于一个物品放在场景中的图片,问题为:"{object color} {object} on the {scene}"。

加载blip-vqa模型。

节点选项说明: image

  • model: 目前有两种模型可选,"blip-vqa-base"和"blip-vqa-capfilt-large"。
  • precision: 模型精度,有"fp16"和"fp32"两个选项。
  • device: 模型运行设备,有"cpu"和"cuda"两个选项。

使图片产生位移。此节点支持位移接缝遮罩的输出,方便制作连续贴图。 image

节点选项说明:
image

  • image5: 输入的图像。
  • mask2,5: 图像的遮罩。
  • shift_x: 位移的横向距离。
  • shift_y: 位移的纵向距离。
  • cyclic: 位移出界的部分是否循环。
  • background_color4: 背景颜色。如果cyclic设置为False,将使用这里的设置作为背景颜色。
  • border_mask_width: 接缝遮罩宽度。
  • border_mask_blur: 接缝遮罩模糊。
  • 节点注解

一个用于合成图层的简单节点,提供多种混合模式供选择,可设置透明度。 image

节点选项说明:
image

  • background_image1: 背景图像。
  • layer_image1: 用于合成的层图像。
  • layer_mask1,2: 层图像的遮罩。
  • invert_mask: 是否反转遮罩。
  • blend_mode3: 图层混合模式。
  • opacity: 不透明度。
  • 节点注解

将多张图片显示在一个卷轴中。可为卷轴中的每张图片添加文字注解。配合ImageReelComposite节点可将多个卷轴拼合为一张图片。 image

节点选项说明:
image

  • image1: 第一张图片。必须输入。
  • image2: 第二张图片。可选输入图片。
  • image3: 第三张图片。可选输入图片。
  • image4: 第四张图片。可选输入图片。
  • image1_text: 第一张图片的文字注解。
  • image2_text: 第二张图片的文字注解。
  • image3_text: 第三张图片的文字注解。
  • image4_text: 第四张图片的文字注解。
  • reel_height: 卷轴高度。
  • border: 卷轴中图片的边框宽度。

输出:

将多个卷轴拼合为一张图片。

节点选项说明:
image

  • reel_1: 第一个卷轴。必须输入。
  • reel_2: 第二个卷轴。可选输入。
  • reel_3: 第三个卷轴。可选输入。
  • reel_4: 第四个卷轴。可选输入。
  • font_file*: 字体文件。
  • border: 卷轴的边框宽度。
  • color_theme: 主题色。
    *font文件夹在resource_dir.ini中定义,这个文件位于插件根目录下, 默认名字是resource_dir.ini.example, 初次使用这个文件需将文件后缀改为.ini。 用文本编辑软件打开,找到“FONT_dir=”开头的这一行,编辑“=”之后为自定义文件夹路径名。 支持定义多个文件夹,之间用逗号,分号或者空格分隔。 文件夹里面所有的.ttf和.otf文件将在ComfyUI初始化时被收集并显示在节点的列表中。 如果ini中设定的文件夹无效,将启用插件自带的font文件夹。

调整图像不透明度。 image

节点选项说明:

  • image5: 图像输入,支持RGB和RGBA输入。
  • mask2,5: 遮罩输入。
  • invert_mask: 是否反转遮罩。
  • opacity: 不透明度。
  • 节点注解

在色板上选取颜色并输出。 改自mtb nodes的web extensions,感谢原作者。 image

节点选项说明:

  • mode: 输出格式,可选十六进制(HEX)或十进制(DEC)。

输出:

  • value: 字符串格式。

将色值输出为单独的R, G, B三个10进制数值。支持ColorPicker节点输出的HEX和DEC格式。

image

节点选项说明:

  • color_value: 支持十六进制(HEX)或十进制(DEC)色值,应是string或tuple类型,强行接入其他类型将导致错误。

将色值输出为单独的H, S, V三个10进制数值(最大值255)。支持ColorPicker节点输出的HEX和DEC格式。 image

节点选项说明:

  • color_value: 支持十六进制(HEX)或十进制(DEC)色值,应是string或tuple类型,强行接入其他类型将导致错误。

将色值输出灰度数值。支持输出256级和100级灰度值。 image

节点选项说明:

  • color_value: 支持十六进制(HEX)或十进制(DEC)色值,应是string或tuple类型,强行接入其他类型将导致错误。

输出:

  • gray(256_level): 256级灰度值。整数类型,范围0~255。
  • gray(100_level): 100级灰度值。整数类型,范围0~100。

从图片中获取主颜色或平均色。 image

节点选项说明: image

  • mode: 模式,有两种可选择,主颜色main_color和平均色average。

输出:

  • RGB color in HEX: 使用16进制RGB字符串格式描述,例如 '#FA3D86'。
  • HSV color in list: HSV颜色值,使用list格式描述。

GetColorTone的V2升级版。可以指定获取主体或背景的主色或平均色。 image image

在GetColorTong基础上做了如下改变: image

  • color_of: 提供4个选项,mask, entire, background和subject, 分别表示选择遮罩区域,整个图片,背景,或主体的颜色。
  • remove_background_method: 背景识别的方法, 有BiRefNet和RMBG V1.4两种可以选择。
  • invert_mask: 是否反转遮罩。
  • mask_grow: 遮罩扩张。对于subject, 更大的值使获得的颜色更接近主体中心的颜色。

输出:

  • image: 纯色图片输出, 尺寸与输入的图片相同。
  • mask: 遮罩输出。

获得图片的主色。可获得5个颜色。 image image

节点选项: image

  • image: 图片输入。
  • k_means_algorithm: K-Means 算法选项。 "lloyd" 为标准K-Means算法, "elkan" 为三角不等式算法,适合更大的图片。

输出:

  • preview_image: 5个主色预览图片。
  • color_1~color_5: 色值输出。输出格式为HEX格式的RGB字符串。

根据色值输出调色盘里最近似的颜色名称。 image

节点选项: image

  • color: 颜色色值输入,格式为HEX格式的RGB字符串。
  • palette: 调色板。 xkcd包括了949种颜色, css3包括了147种颜色, html4包括了16种颜色。

输出:

  • color_name: 颜色名称,格式为字符串。

扩展画布。 image

节点选项说明: image

  • invert_mask: 是否反转遮罩。
  • top: 顶部扩展值。
  • bottom: 底部扩展值。
  • left: 左侧扩展值。
  • right: 右侧扩展值。
  • color: 画布颜色

ExtendCanvas的V2升级版。

在ExtendCanvas基础上修改了color为字符串类型,支持外接ColorPicker输入。支持负值输入,负值将被裁剪。 image

XY to Percent

image
将绝对坐标转换为百分比坐标。

image
节点选项说明:

  • x: 坐标x值。
  • y: 坐标y值。

image
这个节点用于单独对layer_image进行变换,可改变大小,旋转,改变长宽比以及镜像翻转。

image
节点选项说明:

  • x: 坐标x值。
  • y: 坐标y值。
  • mirror: 镜像翻转。提供2种翻转模式, 水平翻转和垂直翻转。
  • scale: 图层放大倍数,1.0 表示原大。
  • aspect_ratio: 图层长宽比。1.0 是原始比例,大于此值表示拉长,小于此值表示压扁。
  • rotate: 图层旋转度数。
  • transform_method: 用于图层放大和旋转的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。不同的采样方法会影响合成的画质和画面处理时间。
  • anti_aliasing: 抗锯齿,范围从0-16,数值越大,锯齿越不明显。过高的数值将显著降低节点的处理速度。

与LayerImageTransform类似,这个节点用于单独对layer_mask进行变换,可改变大小,旋转,改变长宽比以及镜像翻转。

image
节点选项说明:

  • x: 坐标x值。
  • y: 坐标y值。
  • mirror: 镜像翻转。提供2种翻转模式, 水平翻转和垂直翻转。
  • scale: 图层放大倍数,1.0 表示原大。
  • aspect_ratio: 图层长宽比。1.0 是原始比例,大于此值表示拉长,小于此值表示压扁。
  • rotate: 图层旋转度数。
  • transform_method: 用于图层放大和旋转的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。不同的采样方法会影响合成的画质和画面处理时间。
  • anti_aliasing: 抗锯齿,范围从0-16,数值越大,锯齿越不明显。过高的数值将显著降低节点的处理速度。

image
生成一张指定颜色和大小的图片。

image
节点选项说明:

  • width: 图像宽度。
  • height: 图像高度。
  • color4: 颜色。

ColorImage的V2升级版。

image
在ColorImage基础上做了如下改变:

  • size_as*: 此处输入图像或遮罩,将按照其尺寸生成输出图像。注意,此输入优先级高于其他的尺寸设置。
  • size**: 尺寸预设。预设可以用户自定义。如果有size_as输入,此处选项将被忽略。
  • custom_width: 图像宽度。当size设置为"custom"时有效。如果有size_as输入,此处选项将被忽略。
  • custom_height: 图像高度。当size设置为"custom"时有效。如果有size_as输入,此处选项将被忽略。

*仅限输入image和mask, 如果强制接入其他类型输入,将导致节点错误。 **预设尺寸在custom_size.ini中定义,这个文件位于插件根目录下。用文本编辑软件打开,编辑自定义尺寸。每行表示一个尺寸,第一个数值是宽度,第二个是高度,中间用小写的"x"分隔。为避免错误请不要输入多余的字符。

image
生成一张指定大小和指定颜色渐变的图片。

image
节点选项说明:

  • width: 图像宽度。
  • height: 图像高度。
  • angle: 渐变角度。
  • start_color4: 开始端颜色。
  • end_color4: 结束端颜色。

GradientImage的V2升级版。

image
在GradientImage基础上做了如下改变:

  • size_as*: 此处输入图像或遮罩,将按照其尺寸生成输出图像。注意,此输入优先级高于其他的尺寸设置。
  • size**: 尺寸预设。预设可以用户自定义。如果有size_as输入,此处选项将被忽略。
  • custom_width: 图像宽度。当size设置为"custom"时有效。如果有size_as输入,此处选项将被忽略。
  • custom_height: 图像高度。当size设置为"custom"时有效。如果有size_as输入,此处选项将被忽略。

*仅限输入image和mask, 如果强制接入其他类型输入,将导致节点错误。 **预设尺寸在custom_size.ini中定义,这个文件位于插件根目录下, 默认名字是custom_size.ini.example, 初次使用这个文件需将文件后缀改为.ini。用文本编辑软件打开,编辑自定义尺寸。每行表示一个尺寸,第一个数值是宽度,第二个是高度,中间用小写的"x"分隔。为避免错误请不要输入多余的字符。

image
对批量图片评分并输出排名靠前的图片。这个节点使用了ImageReward作为图片评分,感谢原作者。

image
节点选项说明:

  • prompt: 可选输入。将prompt在此输入将作为依据判定其与图片的符合程度。
  • output_nun: 输出的图片数量。此数值应小于图片批量。

输出:

  • images: 按评分顺序从高到低输出的批量图片。
  • obsolete_images: 淘汰的图片。同样按评分顺序从高到低输出。

image
从文字生成简单排版的图片以及遮罩。这个节点参考了ZHO-ZHO-ZHO/ComfyUI-Text_Image-Composite的部分功能和代码,感谢原作者。

image
节点选项说明:

  • size_as*: 此处输入图像或遮罩,将按照其尺寸生成输出图像和遮罩。注意,此输入优先级高于下面的width和height。
  • text: 文字输入。
  • font_file**: 这里列出了font文件夹中可用的字体文件列表,选中的字体文件将被用来生成图像。
  • align: 对齐选项。有居中,靠左和靠右三个选项。
  • char_per_line: 每行字符数量,超过的部分将自动换行。
  • leading: 行间距。
  • font_size: 字体大小。
  • text_color: 文字颜色。
  • stroke_width: 描边宽度。
  • stroke_color: 描边颜色。
  • x_offset: 文字位置的水平偏移量。
  • y_offset: 文字位置的垂直偏移量。
  • width: 画面的宽度。如果有size_as输入,此设置将被忽略。
  • height: 画面的高度。如果有size_as输入,此设置将被忽略。

*仅限输入image和mask, 如果强制接入其他类型输入,将导致节点错误。 **font文件夹在resource_dir.ini中定义,这个文件位于插件根目录下, 默认名字是resource_dir.ini.example, 初次使用这个文件需将文件后缀改为.ini。 用文本编辑软件打开,找到“FONT_dir=”开头的这一行,编辑“=”之后为自定义文件夹路径名。 支持定义多个文件夹,之间用逗号,分号或者空格分隔。 文件夹里面所有的.ttf和.otf文件将在ComfyUI初始化时被收集并显示在节点的列表中。 如果ini中设定的文件夹无效,将启用插件自带的font文件夹。

image
从文字生成图片以及遮罩。支持字间距行间距调整,横排竖排调整,可设置文字的随机变化,包括大小和位置的随机变化。

image
节点选项说明:

  • size_as*: 此处输入图像或遮罩,将按照其尺寸生成输出图像和遮罩。注意,此输入优先级高于下面的width和height。
  • font_file**: 这里列出了font文件夹中可用的字体文件列表,选中的字体文件将被用来生成图像。
  • spacing: 字间距,以像素为单位。
  • leading: 行间距,以像素为单位。
  • horizontal_border: 侧边边距。此处数值表示的是百分比,例如50表示起点位于两侧的正中央。如果文字是横排,是左侧边距,竖排则是右侧边距。
  • vertical_border: 顶部边距。此处数值表示的是百分比,例如10表示起点位于距顶部10%的位置。
  • scale: 文字总体大小。文字的初始大小是根据画面尺寸和文字内容自动计算,默认以最长的行或者列适配画面宽或者高。调整此处数值将整体放大和缩小文字。此处数值表示的是百分比,例如60表示缩放到60%。
  • variation_range: 字符随机变化范围。此数值大于0时,字符将产生大小和位置的随机变化,数值越大,变化幅度越大。
  • variation_seed: 随机变化的种子。固定此数值,每次产生的单个文字的变化不会改变。
  • layout: 文字排版。有横排和竖排可选择。
  • width: 画面的宽度。如果有size_as输入,此设置将被忽略。
  • height: 画面的高度。如果有size_as输入,此设置将被忽略。
  • text_color: 文字颜色。
  • background_color4: 背景颜色。

*仅限输入image和mask, 如果强制接入其他类型输入,将导致节点错误。 **font文件夹在resource_dir.ini中定义,这个文件位于插件根目录下, 默认名字是resource_dir.ini.example, 初次使用这个文件需将文件后缀改为.ini。 用文本编辑软件打开,找到“FONT_dir=”开头的这一行,编辑“=”之后为自定义文件夹路径名。 支持定义多个文件夹,之间用逗号,分号或者空格分隔。 文件夹里面所有的.ttf和.otf文件将在ComfyUI初始化时被收集并显示在节点的列表中。 如果ini中设定的文件夹无效,将启用插件自带的font文件夹。

image
本节点合并自 heshengtao 提交的PR, 在TextImage节点基础上,修改图片文字节点的缩放,字体间隔跟随缩放,坐标不再以文字左上角,而是整行文字的中心点。感谢作者的贡献。

image
根据图像遮罩擦除物体。本节点是对IOPaint的封装,由 SOTA AI 模型提供支持, 感谢原作者。
提供LaMa, LDM, ZITS,MAT, FcF, Manga 模型以及 SPREAD 擦除方法。请查看链接了解各个模型的介绍。
请下载模型文件 lama models(百度网盘) 或者 lama models(Google Drive), 将文件放到ComfyUI/models/lama

节点选项说明: image

  • lama_model: 选择模型或方法。
  • device: 在正确安装torch和Nvidia CUDA驱动程序后,使用cuda将明显提高运行速度。
  • invert_mask: 是否反转遮罩。
  • grow: 遮罩扩张幅度。正值是向外扩张,负值是向内收缩。
  • blur: 遮罩模糊幅度。

image
将图像通道拆分为单独的图片。

节点选项说明: image

  • mode: 通道模式。包含RGBA, YCbCr, LAB和HSV。

image
将各通道合并为一张图片。

节点选项说明: image

  • mode: 通道模式。包含RGBA, YCbCr, LAB和HSV。

image
移除图片的alpha通道,将图片转换为RGB模式。可选择填充背景以及设置背景颜色。

节点选项说明: image

  • RGBA_image: 输入的图像,支持RGBA或RGB模式。
  • mask:可选输入遮罩。如果有输入遮罩将优先使用, 忽略RGBA_image自带的alpha。
  • fill_background: 是否填充背景。
  • background_color4: 背景颜色。

image
将图片与遮罩合并为包含alpha通道的RGBA模式的图片。

image
自动抠图并按照遮罩裁切图片。可指定生成图片的背景颜色、长宽比和大小。这个节点是为生成训练模型的图片素材而设计的。
*请参照 SegmentAnythingUltraRemBgUltra 节点的模型安装方法安装模型。

节点选项说明: image

  • background_color4: 背景颜色。
  • aspect_ratio: 输出的宽高比。这里提供了常见的画幅比例, "custom"为自定义比例。
  • proportional_width: 比例宽。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • proportional_height: 比例高。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • scale_by_longest_side: 允许按长边尺寸缩放。
  • longest_side: scale_by_longest_side被设置为True时,此项将作为是图像长边的长度。
  • detect: 探测方法,min_bounding_rect是最小外接矩形, max_inscribed_rect是最大内接矩形。
  • border_reserve: 保留边框。在探测到的遮罩主体区域之外扩展裁切范围。
  • ultra_detail_range: 遮罩边缘超精细处理范围,0为不处理,可以节省生成时间。
  • matting_method: 生成遮罩的方法。有Segment Anything和 RMBG 1.4两种方法。RMBG 1.4运行速度更快。
  • sam_model: 此处选择Segment Anything所使用的sam模型。
  • grounding_dino_model: 此处选择Segment Anything所使用的grounding_dino模型。
  • sam_threshold: Segment Anything的阈值。
  • sam_prompt: Segment Anything的提示词。

输出: cropped_image: 裁切并更换背景后的图像。 box_preview: 裁切位置预览。 cropped_mask: 裁切后的遮罩。

ImageAutoCrop的V2升级版,在之前基础上做了如下改变:
image

  • 增加mask可选输入。当有mask输入时,直接使用该输入跳过内置遮罩生成。
  • 增加fill_background, 当此项设置为False时将不处理背景,并且超出画幅的部分不纳入输出范围。
  • aspect_ratio增加original(原始画面宽高比)选项。
  • scale_by: 允许按长边、短边、宽度或高度指定尺寸缩放。
  • scale_by_length: 这里的数值作为scale_by指定边的长度。

自动裁切图片到指定的尺寸。可输入mask以保留遮罩指定的区域。这个节点是为生成训练模型的图片素材而设计的。

节点选项说明: image

  • image: 输入的图像。
  • mask: 可选输入遮罩。遮罩部分将在裁切长宽比例范围内得到保留。
  • aspect_ratio: 输出的宽高比。这里提供了常见的画幅比例, "custom"为自定义比例, "original"为原始画面比例。
  • proportional_width: 比例宽。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • proportional_height: 比例高。如果aspect_ratio选项不是"custom",此处设置将被忽略。
  • method: 缩放的采样方法,包括lanczos、bicubic、hamming、bilinear、box和nearest。
  • scale_to_side: 允许按长边、短边、宽度、高度或总像素指定尺寸缩放。
  • scale_to_length: 这里的数值作为scale_to_side指定边的长度, 或者总像素数量(kilo pixels)。
  • round_to_multiple: 倍数取整。例如设置为8,宽和高将强制设置为8的倍数。

输出: cropped_image: 裁切后的图像。 box_preview: 裁切位置预览。

使用低频滤波加保留高频来恢复图像细节。相比kijai's DetailTransfer, 这个节点在保留细节的同时,与环境的融合度更好。 image

节点选项说明:
image

  • image: 背景图片输入。
  • detail_image: 细节原图输入。
  • mask: 可选输入,如果有遮罩输入则仅恢复遮罩部分的细节。
  • keep_high_freq: 保留的高频部分范围。数值越大,保留的高频细节越丰富。
  • erase_low_freq: 擦除的低频部分范围。数值越大,擦除的低频范围越多。
  • mask_blur: 遮罩边缘模糊度。仅在有遮罩输入的情况下有效。

image
获取图片的宽度和高度。

输出:

  • width: 图像宽度。
  • height: 图像高度。
  • original_size: 图像的原始大小数据,用于后续节点进行恢复。

从多路输入图片和遮罩中切换其中一组输出,支持9组输入。所有的输入项都是可选项。如果一组输入中只有image或者只有mask, 缺失项将输出为None。 image

节点选项说明:
image

  • output: 切换输出。数值是对应的输入组。当random_output选项为True时,此项设置将被忽略。
  • random_output: 当此项为True时, 将忽略output设置,在所有的有效输入中随机输出一组。

从批量图片或遮罩中获取指定的图片或遮罩。 image

节点选项说明:
image

  • images: 批量图片输入。此输入为可选项。
  • masks: 批量遮罩输入。此输入为可选项。
  • select: 选择输出的图片或遮罩在批量的索引值,0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。 注意:如果数值超出批量,将输出最后一张。如果没有对应的输入,将输出一个空的64x64图片或64x64黑色遮罩。

image
将多段文字组合为一段。

image
TextJoin 的基础上增加了分隔符选项。

image
用于给工作流调试提供辅助。当运行时,任何接上这个节点的对象的属性将被打印到控制台。

这个节点允许任意类型的输入。

image
输出字符串。

image
输出字符串。与TextBox作用相同。

image
输出一个整数。

image
输出一个浮点数,精度是小数点后5位。

image
输出一个布尔值。

用于生成指定范围内的随机数,有int,float,bool输出,支持批量和列表,支持按图片批量生成一组不同的随机数列表。 image

节点选项说明: image

  • image: 可选输入,按照图片批量生成数量相符的随机数列表。
  • min_value:最小值。随机数将从最小值到最大值之间随机取值。
  • max_value:最大值。随机数将从最小值到最大值之间随机取值。
  • float_decimal_places:浮点数精度。
  • fix_seed:是否固定随机数种子。如果此选项固定,生成的随机数将始终相同。

输出: int: 整数随机数。 float: 浮点数随机数。 bool: 布尔随机数。

RandomGenerator 的基础上,增加了最小随机范围选项,以及seed选项。

节点选项说明: image

  • image: 可选输入,按照图片批量生成数量相符的随机数列表。
  • min_value:最小值。随机数将从最小值到最大值之间随机取值。
  • max_value:最大值。随机数将从最小值到最大值之间随机取值。
  • least: 最小随机范围。随机数将至少取到该值。
  • float_decimal_places:浮点数精度。
  • seed: 随机数种子。
  • control_after_generate: 种子值变化选项。如果此选项固定,生成的随机数将始终相同。

输出: int: 整数随机数。 float: 浮点数随机数。 bool: 布尔随机数。

image
对两个数值进行数学运算并输出整数和浮点数结果*。支持的运算包括+-*/**//%

* 输入仅支持布尔值、整数和浮点数,强行接入其他数据将导致错误。

image
NumberCalculator的升级版,增加了节点内数值输入,增加了开方运算。开方运算选项为nth_root 注意:数值输入更优先,当有输入时节点内数值将无效。

image
对两个数值进行布尔运算并输出结果*。支持的运算包括==!=andorxornotminmax

* 输入仅支持布尔值、整数和浮点数,强行接入其他数据将导致错误。数值之间的and运算输出较大的数,or运算输出较小的数。

image
BooleanOperator的升级版,增加了节点内数值输入,增加了大于、小于、大于等于、小于等于的判断。 注意:数值输入更优先,当有输入时节点内数值将无效。

image
判断文本中是否包含或不包含子字符串,输出布尔值。

节点选项说明:
image

  • text: 输入的文本。
  • condition: 判断条件。include判断是否包含子字符串,exclude判断是否不包含子字符串。
  • sub_string: 子字符串文本。

检测遮罩是否包含足够的有效区域, 输出布尔值。

节点选项说明:
image

  • white_point: 判断遮罩是否有效的白点值,高于此值被计入有效。
  • area_percent: 有效区域所占百分比。检测有效区域占比超过此值则输出True。

在CheckMask基础上增加了method选项,可以选择不同的检测方法。area_percent改为浮点数,精度为小数点后2位,可检测更小的有效区域。

节点选项说明:
image

  • method: 检测方法,有simpledetect_percent 两种。simple方法仅检测mask是否全黑,detect_percent方法检测有效区域占比。

image
根据布尔值条件输入切换输出。可用于任意类型的数据切换,包括且不限于数值、字符串、图片、遮罩、模型、latent、pipe管线等。

节点选项说明:
image

  • if_condition: 条件输入。支持布尔值、整数、浮点数和字符串输入。输入数值时,0被判断为False;输入字符串时,空字符串被判断为Flase。
  • when_True: 当条件为True时,将输出此项。
  • when_False: 当条件为False时,将输出此项。

image
根据匹配字符串切换输出。可用于任意类型的数据切换,包括且不限于数值、字符串、图片、遮罩、模型、latent、pipe管线等。最多支持3组case切换。 将case与switch_condition进行比较,如果相同,则输出对应的输入项。如果有相同的case则按顺序优先输出。如果没有匹配的case,则输出默认的输入项。请注意,字符串区分大小写和中英文全角半角。

节点选项说明:
image

  • input_default: 用于默认输出的输入项。此输入是必选项。
  • input_1: 用于匹配case_1的输入项。此输入是可选项。
  • input_2: 用于匹配case_2的输入项。此输入是可选项。
  • input_3: 用于匹配case_3的输入项。此输入是可选项。
  • switch_condition: 用于与case判断的字符串。
  • case_1: case_1字符串。
  • case_2: case_2字符串。
  • case_3: case_3字符串。

image
停止当前的队列。执行到此节点时,队列将停止。上图工作流示意了如果图片大于1Mega像素时,队列将停止执行。

节点选项说明:
image

  • mode: 停止模式。如果选择stop,将按输入条件决定是否停止。如果选择continue则忽略条件继续执行队列
  • stop: 如果为True,队列将停止。如果为False,队列将继续执行。

image
清理GPU显存。可以接入任意类型的输入,当执行到这个节点时将清理VRAM以及RAM中的垃圾对象。通常放置在推理任务完成的节点之后,例如VAE Decode节点。

节点选项说明:

  • purge_cache: 清理缓存。
  • purge_models: 清理已加载的模型。

image
增强版的保存图片节点。可自定义保存图片的目录,文件名增加时间戳,选择保存格式,设置图片压缩率,设置是否保存工作流,以及可选给图片添加隐形水印(以肉眼无法觉察的方式添加信息,使用配套的ShowBlindWaterMark节点可以解码水印)。可选择是否同时输出工作流的json文件。

节点选项说明: image

  • iamge: 输入的图片。
  • custom_path*: 用户自定义目录,请按正确的格式输入目录名。如果为空则保存在ComfyUI默认的output目录。
  • filename_prefix*:文件名前缀。。
  • timestamp: 为文件名加上时间戳,可选择日期、时间到秒和时间到毫秒。
  • format:图片保存格式。目前提供png和jpg两种。注意RGBA模式的图片仅支持png格式。
  • quality:图片质量,数值范围10-100,数值越高,图片质量越好,文件的体积也对应增大。
  • meta_data:是否保存元数据即工作流信息到png文件。如果不希望泄露工作流,请把这里设置为false。
  • blind_watermark:这里输入的文字(不支持多语言)将被转换为二维码作为隐形水印保存,使用ShowBlindWaterMark节点可以解码水印。注意有水印的图片建议保存为png格式,质量较低的jpg格式将导致水印信息丢失。
  • save_workflow_as_json: 是否同时输出工作流为json文件(输出的json与图片在同一目录)。
  • preview: 预览开关。

*输入%date表示当前日期(YY-mm-dd),%time表示当前时间(HH-MM-SS)。可以输入/表示子目录。例如%date/name_%time 将输出图片到YY-mm-dd文件夹下,以name_HH-MM-SS为文件名前缀。

image
用于保存训练集图片及其文本标签的节点,图片文件和文本标签文件具有相同的文件名。可自定义保存图片的目录,文件名增加时间戳,选择保存格式,设置图片压缩率。 *工作流image_tagger_save_example.json在workflow目录中。

节点选项说明: image

  • iamge: 输入的图片。
  • tag_text: 文本标签。
  • custom_path*: 用户自定义目录,请按正确的格式输入目录名。如果为空则保存在ComfyUI默认的output目录。
  • filename_prefix*:文件名前缀。。
  • timestamp: 为文件名加上时间戳,可选择日期、时间到秒和时间到毫秒。
  • format:图片保存格式。目前提供png和jpg两种。
  • quality:图片质量,数值范围10-100,数值越高,图片质量越好,文件的体积也对应增大。
  • preview: 预览开关。

*输入%date表示当前日期(YY-mm-dd),%time表示当前时间(HH-MM-SS)。可以输入/表示子目录。例如%date/name_%time 将输出图片到YY-mm-dd文件夹下,以name_HH-MM-SS为文件名前缀。

image
给图片添加隐形水印。以肉眼无法觉察的方式添加水印图片,使用ShowBlindWaterMark节点可以解码水印。

节点选项说明: image

  • iamge: 输入的图片。
  • watermark_image: 水印图片。这里输入的图片将自动转为正方形的黑白图片作为水印。建议使用二维码作为水印。

AddBlindWaterMarkSaveImagePlus 节点添加的隐形水印解码。 image

生成一个正方形的二维码图片。

节点选项说明:
image

  • size: 生成图片的边长。
  • border: 二维码四周边框的大小,数值越大,边框越宽。
  • text: 这里输入二维码文字内容,不支持多语言。

解码二维码。

节点选项说明:
image

  • image: 输入二维码图片。
  • pre_blur: 预模糊,对难以识别的二维码可以尝试调整此数值。

image
image
加载PSD格式文件,并导出图层。 注意这个节点需要安装psd_tools依赖包,如果安装psd_tool中出现ModuleNotFoundError: No module named 'docopt'错误,请下载docopt的whl手动安装。

节点选项说明:
image

  • image: 这里列出了ComfyUI/input下的*.psd文件,之前加载过的psd图片可以从这里选择。
  • file_path: psd文件的完整路径以及文件名。
  • include_hidden_layer: 是否包括隐藏图层。
  • find_layer_by: 查找图层的方法,可选择按图层索引编号或者图层名称查找。图层组被作为一个图层对待。
  • layer_index: 图层索引编号,0是最下面的图层,依次递增。如果include_hidden_layer设置为false,隐藏的图层不计入。设为-1则输出最上层的图层。
  • layer_name: 图层名称。注意大小写和标点符号必须完全匹配。

输出: flat_image: psd预览图。 layer_iamge: 查找的图层输出。 all_layers: 包含全部图层的批量图片。

image
把SD3的Negative Conditioning 的4个节点封装为一个单独节点。

节点选项说明:
image

  • zero_out_start: 设置Negative ConditioningZeroOut的ConditioningSetTimestepRange start值, 此数值与Negative的ConditioningSetTimestepRange end值相同。

image

Photoshop图层样式-混合颜色带功能的复现。该节点输出一个mask,用于在ImageBlend或者ImageBlendAdvance节点进行图层合成。 mask为可选输入项,如果这里输入遮罩,将作用于输出结果。 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • blend_if: 混合色带的通道选择。有gray, red, green, blue四个选项。
  • black_point: 黑点值,取值范围从0-255。
  • black_range: 暗部过渡范围。数值越大,暗部遮罩的过渡层次越丰富。
  • white_point: 白点值,取值范围从0-255。
  • white_range: 亮部过渡范围。数值越大,亮部遮罩的过渡层次越丰富。

探测mask所在区域,并输出位置和大小。 image

节点选项说明:
image

  • detect: 探测方法,min_bounding_rect是大块形状最小外接矩形, max_inscribed_rect是大块形状最大内接矩形, mask_area是遮罩像素有效区域。
  • x_adjust: 修正探测之后的水平偏移。
  • y_adjust: 修正探测之后的垂直偏移。
  • scale_adjust: 修正探测之后的缩放偏移。

输出:

  • box_preview: 探测结果预览图。红色表示探测到的结果,绿色表示加上修正后的输出结果。
  • x_percent: 水平位置以百分比输出。
  • y_percent: 垂直位置以百分比输出。
  • width: 宽度输出。
  • height: 高度输出。
  • x: 左上角位置x坐标输出。
  • y: 左上角位置y坐标输出。

Ultra节点组

image
一组使用了超精细边缘遮罩处理方法的节点,最新版节点包括SegmentAnythingUltraV2, RmBgUltraV2, BiRefNetUltra, PersonMaskUltraV2, SegformerB2ClothesUltra 和 MaskEdgeUltraDetailV2。 这些节点有3种边缘处理方法:

  • PyMatting 通过遮罩 trimap, 对遮罩进行closed-form matting优化边缘。
  • GuideFilter 使用 opencv guidedfilter 根据颜色相似度对边缘进行羽化,对于边缘具有很强的颜色分离时效果最佳。
    以上两种方法的代码来着spacepxl的ComfyUI-Image-Filters的Alpha Matte节点,感谢原作者。
  • VitMatte 使用transfromer vit模型进行高质量的边缘处理,保留边缘细节,甚至可以生成半透明遮罩。
  • VitMatte的选项:device 设置是否使用cuda进行vitmatte运算,cuda运算速度比cpu快5倍左右。max_megapixels设置vitmatte运算的最大图片尺寸,超大的图片将缩小处理。对于16G显存建议设置为3。

*请从 百度网盘 或者 Huggingface 下载全部模型文件到ComfyUI/models/vitmatte文件夹。

下图为三种方法输出区别的示例。 image

ComfyUI Segment Anything的改进,使遮罩有更具细节的边缘,感谢原作者。 *请参照ComfyUI Segment Anything的安装方法安装模型。如果已经正确安装了ComfyUI Segment Anything,可跳过此步骤。

image
image

节点选项说明:
image

  • sam_model: 选择SAM模型。
  • ground_dino_model: 选择Grounding DINO模型。
  • threshold: SAM阈值。
  • detail_range: 边缘细节范围。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • prompt: SAM的prompt输入。
  • cache_model: 是否缓存模型。

SegmentAnythingUltra的V2升级版,增加了VITMatte边缘处理方法。 image

在SegmentAnythingUltra的基础上做了如下改变:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

本节点是kijai/ComfyUI-segment-anything-2的改造版本。感谢kijai为ComfyUI社区做出的巨大贡献。
SAM2 Ultra 节点仅支持单张图片,如果需要处理多张图片,请先将image batch 转换为 image list。
*请从百度网盘 或者 huggingface.co/Kijai/sam2-safetensors下载全部模型文件并复制到ComfyUI/models/sam2文件夹。

image

节点选项说明:
image

  • image: 图片输入。
  • bboxes: 识别框数据输入。
  • sam2_model: 选择SAM2模型。
  • presicion: 模型精度,可选择fp16, bf16 和 fp32。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。
  • cache_model: 是否缓存模型。缓存模型后将节省模型加载的时间。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

SAM2 Video Ultra 节点支持处理多张图片或视频序列帧。请在序列的第一帧定义识别框数据以保证正确识别。

sam2_video_ultra_example.mp4
2024-09-03.152625.mp4

节点选项说明:
image

  • image: 图片输入。
  • bboxes: 可选输入,识别框数据输入。bboxes 和 first_frame_mask 二者必须输入其中之一。如果有first_frame_mask输入,bboxes将被忽略。
  • first_frame_mask: 可选输入遮罩,这里的遮罩将作为首帧识别对象。bboxes 和 first_frame_mask 二者必须输入其中之一。如果有first_frame_mask输入,bboxes将被忽略。
  • pre_mask: 可选输入遮罩,这里的遮罩将作为传播关注范围限制,有助于提高识别准确度。
  • sam2_model: 选择SAM2模型。
  • presicion: 模型精度,可选择fp16, bf16。
  • cache_model: 是否缓存模型。缓存模型后将节省模型加载的时间。
  • individual_object: 当设置为 True时,将专注于识别单一对象。设置为False时,将尝试为多个对象生成识别框。
  • mask_preview_color: 在预览输出中显示非遮罩区域的颜色。
  • detail_method: 边缘处理方法。仅VITMatte可用。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 本节点限制仅使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。更大的尺寸将获得更精细的遮罩边缘,但会导致运算速度明显下降。

使用Florence2模型识别图片中的对象,并输出识别框数据。
*请从 百度网盘下载模型文件并复制到ComfyUI/models/florence2文件夹。

节点选项说明:
image

  • image: 图片输入。
  • florence2_model: Florence2模型。从Florence2模型加载器输入。
  • prompt: 描述需要识别的对象。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为按置信度排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

使用YOLO World模型识别图片中的对象,并输出识别框数据。
*请从 百度网盘GoogleDrive下载模型文件并复制到ComfyUI/models/yolo-world文件夹。

节点选项说明:
image

  • image: 图片输入。
  • confidence_threshold: 置信度阈值。
  • nms_iou_threshold: 非极大值抑制阈值。
  • prompt: 描述需要识别的对象。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为按置信度排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

使用YOLO 8模型识别图片中的对象,并输出识别框数据。
*请在 GoogleDrive 或者 百度网盘 下载模型文件并放到 ComfyUI/models/yolo 文件夹。

节点选项说明:
image

  • image: 图片输入。
  • yolo_model: 选择yolo模型。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为按置信度排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

使用遮罩作为识别框数据。遮罩上所有被白色区域包围的区域,将被识别为一个对象。多个封闭区域将各自识别。

节点选项说明:
image

  • object_mask: 遮罩输入。
  • sort_method: 选择框排序方法, 有4个选项:"left_to_right"为从左到右排序,"top_to_bottom"为从上到下排序,"big_to_small"为从大到小排序,"confidence"为默认排序。
  • bbox_select: 选择输入的框数据。有3个选项:"all"为全部选择,"first"为选择置信度最高的框,"by_index"可以指定框的索引。
  • select_index: 当bbox_select为"by_index"时,此选项有效。0为第一张。可以输入多个值,中间用任意非数字字符分隔,包括不仅限于逗号,句号,分号,空格或者字母,甚至中文。

合并识别框数据。

节点选项说明:
image

  • bboxes_1: 必选输入。第一组识别框。
  • bboxes_2: 可选输入。第二组识别框。
  • bboxes_3: 可选输入。第三组识别框。
  • bboxes_4: 可选输入。第四组识别框。

将ObjectDetector节点输出的识别框数据绘制为遮罩。
image

节点选项说明:
image

  • image: 图片输入。必须与ObjectDetector节点识别的图片一致。
  • bboxes: 识别框数据输入。
  • grow_top: 每个识别框向上扩展范围,为识别框高度的百分比。正值为向上扩展,负值为向下扩展。
  • grow_bottom: 每个识别框向下扩展范围,为识别框高度的百分比,正值为向下扩展,负值为向上扩展。
  • grow_left: 每个识别框向左扩展范围,为识别框宽度的百分比。正值为向左扩展,负值为向右扩展。
  • grow_right: 每个识别框向右扩展范围,为识别框宽度的百分比。正值为向右扩展,负值为向左扩展。

本节点是EVF-SAM在ComfyUI中的实现。
*请从百度网盘 或者 huggingface/EVF-SAM2, huggingface/EVF-SAM 下载全部模型文件并复制到ComfyUI/models/EVF-SAM文件夹(请将模型保存在各自子目录中)。

image

节点选项说明:
image

  • image: 图片输入。
  • model: 选择模型。目前有 evf-sam2 和 evf-sam 可选。
  • presicion: 模型精度,可选择fp16, bf16 和 fp32。
  • load_in_bit: 按位精度加载模型。可选择full, 8 和 4。
  • pormpt: 用于分割的提示词。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

使用 Florence2 模型的分割功能,同时具有超高的边缘细节。 本节点部分的代码来自spacepxl/ComfyUI-Florence-2,感谢原作者。 *请从 百度网盘下载模型文件并复制到ComfyUI/models/florence2文件夹。

image

节点选项说明:
image

  • florence2_model: Florence2模型输入。
  • image: 图片输入。
  • task: 选择florence2任务。
  • text_input: florence2任务文本输入。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

Florence2 模型加载器。 image
目前有 base, base-ft, large, large-ft, DocVQA, SD3-Captioner 和 base-PromptGen模型可以选择。

去除背景。与类似的背景移除节点相比,这个节点具有超高的边缘细节。 本节点结合了spacepxl的ComfyUI-Image-Filters的Alpha Matte节点,以及ZHO-ZHO-ZHO的ComfyUI-BRIA_AI-RMBG的功能,感谢原作者。

*请从 BRIA Background Removal v1.4 或者 百度网盘下载模型文件至ComfyUI/models/rmbg/RMBG-1.4文件夹。该模型由 BRIA AI 开发,可作为非商业用途的开源模型。

image

节点选项说明:
image

  • detail_range: 边缘细节范围。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。

RemBgUltra的V2升级版,增加了VITMatte边缘处理方法。

在RemBgUltra的基础上做了如下改变:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

使用BiRefNet模型去除背景,有更好的识别能力,同时具有超高的边缘细节。 本节点模型部分的代码来自vipery的ComfyUI-BiRefNet,感谢原作者。

*从https://huggingface.co/ViperYX/BiRefNet 或者 百度网盘 下载BiRefNet-ep480.pth,pvt_v2_b2.pth,pvt_v2_b5.pth,swin_base_patch4_window12_384_22kto1k.pth, swin_large_patch4_window12_384_22kto1k.pth5个文件至ComfyUI/models/BiRefNet文件夹。

image

节点选项说明:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

本节点支持使用最新的BiRefNet模型。
*从百度网盘GoogleDrive 下载 BiRefNet-general-epoch_244.pthComfyUI/Models/BiRefNet/pth 文件夹。也可以下载更多的BiRefNet模型放到这里。

image

节点选项说明:
image

  • image: 图片输入。
  • birefnet_model: BiRefNet模型输入,模型从LoadBiRefNetModel节点输出。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 由于BiRefNet的边缘处理已经非常不错,此处默认设为False。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

加载BiRefNet模型。

节点选项说明:
image

  • model: 选择模型。列出 CoomfyUI/models/BiRefNet/pth 文件夹下的文件供选择。

使用transparent-background模型去除背景,有更好的识别能力和识别速度,同时具有超高的边缘细节。

*从 googledrive百度网盘 下载全部文件至ComfyUI/models/transparent-background文件夹。

image

节点选项说明:
image

  • model: 选择模型。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

为人物生成脸、头发、身体皮肤、衣服或配饰的遮罩。与之前的A Person Mask Generator节点相比,这个节点具有超高的边缘细节。 本节点的模型代码来自a-person-mask-generator,边缘处理代码来自spacepxl的ComfyUI-Image-Filters,感谢原作者。 *从百度网盘 下载模型文件并放到ComfyUI/models/mediapipe文件夹。

image

节点选项说明:
image

  • face: 脸部识别。
  • hair: 头发识别。
  • body: 身体皮肤识别。
  • clothes: 衣服识别。
  • accessories: 配饰(例如背包)识别。
  • background: 背景识别。
  • confidence: 识别阈值,更低的值将输出更多的遮罩范围。
  • detail_range: 边缘细节范围。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。

PersonMaskUltra的V2升级版,增加了VITMatte边缘处理方法。

在PersonMaskUltra的基础上做了如下改变:
image

  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

image
为人物生成脸、头发、手臂、腿以及服饰的遮罩,主要用于分割服装。模型分割代码来自StartHua,感谢原作者。 与comfyui_segformer_b2_clothes节点相比,这个节点具有超高的边缘细节。

*从huggingface 或者 百度网盘 下载全部文件至ComfyUI/models/segformer_b2_clothes文件夹。

节点选项说明:
image

  • face: 脸部识别。
  • hair: 头发识别。
  • hat: 帽子识别。
  • sunglass: 墨镜识别。
  • left_arm:左手臂识别。
  • right_arm:右手臂识别。
  • left_leg:左腿识别。
  • right_leg:右腿识别。
  • skirt:短裙识别。
  • pants:裤子识别。
  • dress:连衣裙识别。
  • belt:腰带识别。
  • shoe:鞋子识别。
  • bag:背包识别。
  • scarf:围巾识别。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

image
image
使用segformer模型分割服饰,具有超高的边缘细节。目前支持segformer b2 clothes, segformer b3 clothes, segformer b3 fashion。

*从huggingface 或者 百度网盘 下载全部文件至ComfyUI/models/segformer_b2_clothes文件夹。
*从huggingface 或者 百度网盘 下载全部文件至ComfyUI/models/segformer_b3_clothes文件夹。
*从huggingface 或者 百度网盘下载全部文件至ComfyUI/models/segformer_b3_fashion文件夹。

节点选项说明:
image

  • image: 图像输入。
  • segformer_pipeline: segformer管线输入。管线由SegformerClothesPipeline和SegformerFashionPipeline节点输出。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

选择segformer clothes模型,并选择分割内容。

节点选项说明:
image

  • model: 模型选择。目前有两种模型可供选择segformer b2 clothes, segformer b3 clothes。
  • face: 脸部识别。
  • hair: 头发识别。
  • hat: 帽子识别。
  • sunglass: 墨镜识别。
  • left_arm:左手臂识别。
  • right_arm:右手臂识别。
  • left_leg:左腿识别。
  • right_leg:右腿识别。
  • left_shoe: 左鞋子识别。
  • right_shoe: 右鞋子识别。
  • skirt:短裙识别。
  • pants:裤子识别。
  • dress:连衣裙识别。
  • belt:腰带识别。
  • bag:背包识别。
  • scarf:围巾识别。

选择segformer fashion模型,并选择分割内容。

节点选项说明:
image

  • model: 模型选择。目前只有一种模型可供选择segformer b3 fashion。
  • shirt: 衬衫、罩衫识别。
  • top: 上衣、t恤、运动衫识别。
  • sweater: 毛衣识别。
  • cardigan: 开襟毛衫识别。
  • jacket: 夹克识别。
  • vest: 背心识别。
  • pants: 裤子识别。
  • shorts: 短裤识别。
  • skirt: 短裙识别。
  • coat: 外套识别。
  • dress: 连衣裙识别。
  • jumpsuit: 连身裤识别。
  • cape: 斗篷识别。
  • glasses: 眼镜识别。
  • hat: 帽子识别。
  • hairaccessory: 头带、头巾、发饰识别。
  • tie: 领带识别。
  • glove: 手套识别。
  • watch: 手表识别。
  • belt: 皮带识别。
  • legwarmer: 腿套识别。
  • tights: 紧身裤和长筒袜识别。
  • sock: 袜子识别。
  • shoe: 鞋子识别。
  • bagwallet: 背包、钱包识别。
  • scarf: 围巾识别。
  • umbrella: 雨伞识别。
  • hood: 兜帽识别。
  • collar: 衣领识别。
  • lapel: 翻领识别。
  • epaulette: 肩章识别。
  • sleeve: 袖子识别。
  • pocket: 口袋识别。
  • neckline: 领口识别。
  • buckle: 带扣识别。
  • zipper: 拉链识别。
  • applique: 贴花识别。
  • bead: 珠子识别。
  • bow: 蝴蝶结识别。
  • flower: 花识别。
  • fringe: 刘海识别。
  • ribbon: 丝带识别。
  • rivet: 铆钉识别。
  • ruffle: 褶饰识别。
  • sequin: 亮片识别。
  • tassel: 流苏识别。

用于分割人体肢体,是基于metal3d/ComfyUI_Human_Parts 的重新封装,感谢原作者。 本节点在原作基础上增加了超精细边缘处理。请从百度网盘huggingface 下载模型文件并复制到 ComfyUI\models\onnx\human-parts 文件夹。 image

节点选项说明:
image

  • image: 图片输入。
  • face: 是否识别人脸。
  • hair: 是否识别头发。
  • galsses: 是否识别眼镜。
  • top_clothes: 是否识别上装。
  • bottom_clothes: 是否识别下装。
  • torso_skin: 是否识别躯干皮肤。
  • left_arm: 是否识别左手臂。
  • right_arm: 是否识别右手臂。
  • left_leg: 是否识别左腿。
  • right_leg: 是否识别右腿。
  • left_foot: 是否识别左脚。
  • right_foot: 是否识别右脚。
  • detail_method: 边缘处理方法。提供了VITMatte, VITMatte(local), PyMatting, GuidedFilter。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • detail_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • detail_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。
  • process_detail: 此处设为False将跳过边缘处理以节省运行时间。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

处理较粗糙的遮罩使其获得超精细边缘。 image

节点选项说明:
image

  • method: 提供PyMatting和OpenCV-GuidedFilter两种方法处理边缘。PyMatting处理速度较慢,但是对于视频,建议使用这种方法获得更平滑的遮罩序列。
  • mask_grow: 遮罩扩张幅度。正值是向外扩张,负值是向内收缩。对于较粗糙的遮罩,通常使用负值使其边缘收缩以获得更好的效果。
  • fix_gap: 修补遮罩中的空隙。如果遮罩中有比较明显的空隙,适当调高此数值。
  • fix_threshold: 修补遮罩的阈值。
  • detail_range: 边缘细节范围。
  • black_point: 边缘黑色采样阈值。
  • white_point: 边缘白色采样阈值。

MaskEdgeUltraDetail的V2升级版,增加了VITMatte边缘处理方法,此方法适合处理半透明区域。 在MaskEdgeUltraDetail的基础上做了如下改变:
image

  • method: 边缘处理方法。增加了VITMatte和VITMatte(local)方法。如果首次使用VITMatte后模型已经下载,之后可以使用VITMatte(local)。
  • edge_erode: 遮罩边缘向内侵蚀范围。数值越大,向内修复的范围越大。
  • edge_dilate: 遮罩边缘向外扩张范围。数值越大,向外修复的范围越大。
  • device: 设置是否使用cuda。
  • max_megapixels: 设置vitmatte运算的最大尺寸。

使用YoloV8模型检测人脸、手部box区域,或者人物分割。支持输出所选择数量的通道。 请在 GoogleDrive 或者 百度网盘 下载模型文件并放到 ComfyUI/models/yolo 文件夹。

image

节点选项说明:
image

  • yolo_model: yolo模型选择。带有seg名字的模型可以输出分割的mask, 否则只能输出box区域的遮罩。
  • mask_merge: 选择合并的遮罩。all是合并全部遮罩输出。选数值是输出多少个遮罩,按识别置信度排序合并输出。

输出:

  • mask: 输出的遮罩。
  • yolo_plot_image: yolo识别结果预览图。
  • yolo_masks: yolo识别出来的所有遮罩,每个单独的遮罩输出为一个mask。

使用Mediapipe模型检测人脸五官,分割左右眉、眼睛、嘴唇和牙齿。 *从百度网盘 下载模型文件并放到ComfyUI/models/mediapipe文件夹。

image

节点选项说明:
image

  • left_eye: 左眼识别开关。
  • left_eyebrow: 左眉识别开关。
  • right_eye: 右眼识别开关。
  • right_eyebrow: 右眉识别开关。
  • lips: 嘴唇识别开关。
  • tooth: 牙齿识别开关。

根据颜色生成遮罩。 image

节点选项说明:
image

  • image: 图像输入。
  • mask: 遮罩输入。此输入是可选项,如果有遮罩则仅遮罩内的颜色被纳入范围。
  • color: 颜色选择器。点击色块选择颜色,可以使用选色器面板上的吸管拾取屏幕颜色。注意:使用吸管时,需将浏览器窗口最大化。
  • color_in_HEX4: 输入色值。如果此项有输入,则优先使用,忽略color选取的颜色。
  • threshold: 遮罩范围阈值,数值越大,遮罩范围越大。
  • fix_gap: 修补遮罩中的空隙。如果遮罩中有比较明显的空隙,适当调高此数值。
  • fix_threshold: 修补遮罩的阈值。
  • invert_mask: 是否反转遮罩。

将图片转为遮罩。支持以LAB,RGBA, YUV 和 HSV模式的任意通道转换为遮罩,同时提供色阶调整。支持mask可选输入以获取仅包括有效部分的遮罩。 image

节点选项说明:
image

  • image: 图像输入。
  • mask: 遮罩输入。此输入是可选项,如果有遮罩则仅遮罩内的颜色被纳入范围。
  • channel: 通道选择。可以选择LAB,RGBA, YUV 和 HSV模式的任意一个通道。
  • black_point*: 遮罩黑点值。取值范围0-255, 默认值0。
  • white_point*: 遮罩白点值。取值范围0-255, 默认值255。
  • gray_point: 遮罩灰点值。取值范围0.01-9.99, 默认1。
  • invert_output_mask: 是否反转遮罩。

*如果 black_point 或 output_black_point 数值大于 white_point 或 output_white_point,则两个数值将交换,较大的数值作为white_point使用,较小的数值作为black_point使用。

Shadow & Highlight Mask

生成图像暗部和亮部的遮罩。 image

节点选项说明:
image

  • image: 图像输入。
  • mask: 可选输入。如果有输入,将只调整遮罩范围内的颜色。
  • shadow_level_offset: 暗部取值的偏移量,更大的数值使更多靠近明亮的区域纳入暗部。
  • shadow_range: 暗部的过渡范围。
  • highlight_level_offset: 亮部取值的偏移量,更小的数值使更多靠近阴暗的区域纳入亮部。
  • highlight_range: 亮部的过渡范围。

Shadow Highlight Mask V2

Shadow & Highlight Mask 节点的复制品,去掉了节点名称中的"&"字符以避免ComfyUI工作流解析错误。

对图像的遮罩边缘部分进行像素扩张预处理,可有效改善图像合成的边缘。 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • mask_grow: 遮罩扩张幅度。

计算两张图像不同之处,并输出为遮罩。 image

节点选项说明:
image

  • gain: 计算增益。调高此值,微弱的差异将更显著的呈现。
  • fix_gap: 修补遮罩内部缝隙。更高的值将修补更大的缝隙。
  • fix_threshold: 修补阈值。
  • main_subject_detect: 此项设为True将开启主体侦测,忽略主体之外的差异。

对mask进行扩张收缩边缘和模糊处理 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • grow: 扩张幅度。正值是向外扩张,负值是向内收缩。
  • blur: 模糊。

使mask边缘平滑地过渡收缩,并保留边缘细节。 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • shrink_level: 收缩平滑级别。
  • soft: 平滑幅度。
  • edge_shrink: 边缘收缩幅度。
  • edge_reserve: 保留边缘细节幅度, 100为完全保留,0为完全不保留。

MaskGrow与MaskEdgeShrink效果对比 image

使mask产生运动模糊。 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • blur: 模糊大小。
  • angle: 模糊角度。

使mask从一侧产生渐变。请注意此节点与CreateGradientMask的区别。 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • gradient_side: 从哪个边产生渐变。有四个方向:顶侧top、底侧bottom、左侧left、右侧right。
  • gradient_scale: 渐变距离。默认值100表示渐变产生一侧完全透明,另一侧完全不透明。数值越小,从透明到不透明的距离越短。
  • gradient_offset: 渐变位置偏移。
  • opacity: 渐变的不透明度。

创建一个渐变的遮罩。请注意此节点与MaskGradient的区别。 image
image

节点选项说明:
image

  • size_as*: 此处输入图像或遮罩,将按照其尺寸生成输出图像和遮罩。注意,此输入优先级高于下面的width和height。
  • width: 画面的宽度。如果有size_as输入,此设置将被忽略。
  • height: 画面的高度。如果有size_as输入,此设置将被忽略。
  • gradient_side: 从哪个边产生渐变。有5个方向:顶侧top、底侧bottom、左侧left、右侧right和中央center。
  • gradient_scale: 渐变距离。默认值100表示渐变产生一侧完全透明,另一侧完全不透明。数值越小,从透明到不透明的距离越短。
  • gradient_offset: 渐变位置偏移。gradient_side为center时这里调整渐变区域的大小,正值是变小,负值是扩大。
  • opacity: 渐变的不透明度。

*仅限输入image和mask, 如果强制接入其他类型输入,将导致节点错误。

产生mask轮廓描边。 image

节点选项说明:
image

  • invert_mask: 是否反转遮罩。
  • stroke_grow: 描边扩张/收缩幅度,正值是扩张,负值是收缩。
  • stroke_width: 描边宽度。
  • blur: 描边模糊。

为遮罩生成噪声。 image

节点选项说明:
image

  • grain: 噪声强度。
  • invert_mask: 是否反转遮罩。

预览mask image

mask反转 image

image

Sharp & Soft

为图像增强细节或抹平细节。 image

节点选项说明: image

  • enhance: 提供四个预设档位,分别是very sharp、sharp、soft和very soft。选None则不做任何处理。

磨皮效果。 image

节点选项说明: image

  • smooth: 皮肤平滑度。
  • threshold: 磨皮范围。数值越小范围越大。
  • opacity: 磨皮的不透明度。

水彩画效果。 image

节点选项说明: image

  • line_density: 线条密度。
  • opacity: 水彩效果的不透明度。

柔光效果。 image

节点选项说明: image

  • soft: 柔光大小。
  • threshold: 柔光范围。柔光从画面最明亮的部分呈现。数值越低范围越大,越高范围越小。
  • opacity: 柔光的不透明度。

通道错位。类似抖音logo的效果。 image

节点选项说明: image

  • distance: 通道分离的距离。

  • angle: 通道分离的角度。

  • mode: 通道错位排列顺序。

HDR Effects

增强图像的动态范围。 这个节点是HDR Effects (SuperBeasts.AI)的重新封装。感谢原作者。 image

节点选项说明: image

  • hdr_intensity: 范围0-5, 控制HDR效果的整体强度, 数值越高,效果越明显。
  • shadow_intensity: 范围0-1,调整图像阴影部分的强度,较高的值会使阴影变暗并增加对比度。
  • highlight_intensity: 范围0-1,调整图像高光部分的强度,较高的值可使高光变亮并增加对比度。
  • gamma_intensity: 范围0-1,用于图像的伽玛校正,值越高,整体亮度和对比度越高。
  • contrast: 范围0-1,增强图像的对比度, 值越高,对比度越明显。
  • enhance_color: 范围0-1,增强图像的色彩饱和度, 值越高,颜色越鲜艳。

模拟胶片的颗粒、暗边和边缘模糊,支持输入深度图模拟虚焦。
这个节点是digitaljohn/comfyui-propost的重新封装,感谢原作者。 image

节点选项说明: image

  • image: 输入的图片。
  • depth_map: 深度图输入,由此模拟虚焦效果。此项是可选输入,如果没有输入则模拟为图片边缘的径向模糊。
  • center_x: 暗边和径向模糊的中心点位置横坐标,0表示最左侧,1表示最右侧,0.5表示在中心。
  • center_y: 暗边和径向模糊的中心点位置纵坐标,0表示最上方,1表示最下方,0.5表示在中心。
  • saturation: 颜色饱和度,1为原始值。
  • grain_power: 噪点强度。数值越大,噪点越明显。
  • grain_scale: 噪点颗粒大小。数值越大,颗粒越大。
  • grain_sat: 噪点的色彩饱和度。0表示黑白噪点,数值越大,彩色越明显。
  • grain_shadows: 暗部噪点强度。
  • grain_highs: 亮部噪点强度。
  • blur_strength: 模糊强度。数值越大越模糊。
  • blur_focus_spread: 焦点扩散范围。数值越大,清晰的范围越大。
  • focal_depth: 模拟虚焦的焦点距离。0表示焦点在最远,1表示焦点在最近。此项设置只在depth_map有输入时才生效。

Film节点的升级版, 在之前基础上增加了fastgrain方法,生成噪点速度加快了10倍。fastgrain的代码来自github.com/spacepxl/ComfyUI-Image-Filters的BetterFilmGrain部分,感谢原作者。 image

模拟胶片漏光效果。请从 百度网盘Google Drive 下载模型文件并复制到 ComfyUI/models/layerstyle 文件夹。 image

节点选项说明: image

  • light: 提供了32种光斑。random为随机选择。
  • corner: 光斑出现的角落,有左上、右上、左下和右下4个选项。
  • hue: 光斑的色相。
  • saturation: 光斑的色彩饱和度。
  • opacity: 光斑的不透明度。

伪彩色热力图效果。 image

节点选项说明: image

  • color_map: 效果类型。共22种,各种类型的效果如上图所示。
  • opacity: 伪彩色效果的不透明度。

运动模糊。 image

节点选项说明:

  • angle: 模糊角度。
  • blur: 模糊大小。

高斯模糊。 image

节点选项说明:

  • blur: 模糊大小。整数,范围 1-999。

高斯模糊。参数精度改为浮点数,精度为0.01

节点选项说明: image

  • blur: 模糊大小。浮点数,范围 0-1000。

给图片增加噪声。 image

节点选项说明: image

  • grain_power: 噪声强度。
  • grain_scale: 噪声的大小。
  • grain_sat: 噪声的色彩饱和度。

1 image、mask和background_image(如果有输入)这三项必须是相同的尺寸。

2 mask不是必须的输入项,默认使用image的alpha通道,如果image输入不包含alpha通道将自动创建整个图像的alpha通道。如果输入mask,原本的alpha通道将被mask覆盖。

3 混合模式 包括normal、multply、screen、add、subtract、difference、darker、lighter、color_burn、color_dodge、linear_burn、linear_dodge、overlay、soft_light、hard_light、vivid_light、pin_light、linear_light、hard_mix, 共19种混合模式。
image
*混合模式预览

3 混合模式V2 包括nomal, dissolve, darken, multiply, color burn, linear burn, darker color, lighten, screen, color dodge, linear dodge(add), lighter color, dodge, overlay, soft light, hard light, vivid light, linear light, pin light, hard mix, difference, exclusion, subtract, divide, hue, saturation, color, luminosity, grain extract, grain merge共30种模式。
混合模式V2的部分代码来自Virtuoso Nodes for ComfyUIBlend Modes节点。感谢原作者。 image
*混合模式V2版预览

4 颜色使用16进制RGB字符串格式描述,例如 '#FA3D86'。

5 image和mask这两项必须是相同的尺寸。

Star 记录

Star History Chart

声明

LayerStyle节点遵照MIT开源协议,有部分功能代码和模型来自其他开源项目,感谢原作者。如果作为商业用途,请查阅原项目授权协议使用。