SingleInsert: Inserting New Concepts from a Single Image to Text-to-Image Models for Flexible Editing

If you find our work useful for your research, please star this repo and cite our paper. Thanks!

@article{wu2023singleinsert,
    author = {Wu, Zijie and Yu, Chaohui and Zhu, Zhen and Wang, Fan and Bai, Xiang.},
    title  = {SingleInsert: Inserting New Concepts from a Single Image into Text-to-Image Models for Flexible Editing},
    journal = {arxiv:2310.08094},
    year   = {2023},

Installation

conda create -n singleinsert python=3.9
conda activate singleinsert

pip install -r requirements.txt

# Install LangSAM for foreground segmentation
pip install -U git+https://github.com/luca-medeiros/lang-segment-anything.git

# Please replace the modeling_clip.py in transformers with the provided one 
cp modeling_clip.py /YOUR/PATH/TO/ENV/singleinsert/lib/python3.9/site-packages/transformers/models/clip/

Mask Preparation

Use command like below for forground mask preparation:

python img2mask.py --input_dir ./data/images --output_dir ./data/masks --input_name 066.jpg --prompt face

Please specify the class name of the intended foreground concept correctly.

Train

Use command like below for training:

python train.py --pretrained_model_name_or_path runwayml/stable-diffusion-v1-5 --instance_image_dir ./data/images --instance_mask_dir ./data/masks --instance_name 066.jpg --class_name "face"

We set the training iterations as 50 for stage 1 and stage 2 by default. For non facial instances, the training iterations could be more or less for better quality.

Test

Use command like below for inference:

python test_lora_emb.py --pretrained_model_name_or_path runwayml/stable-diffusion-v1-5 --prompt "A man with red hair, _*_ face"

Acknowledgments

The code is based on project Dreambooth. We sincerely thank them for their great work!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SingleInsert: Inserting New Concepts from a Single Image to Text-to-Image Models for Flexible Editing

Installation

Mask Preparation

Train

Test

Acknowledgments

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
data		data
output		output
test		test
README.md		README.md
img2mask.py		img2mask.py
model.py		model.py
modeling_clip.py		modeling_clip.py
requirements.txt		requirements.txt
teaser.png		teaser.png
test_lora_emb.py		test_lora_emb.py
train.py		train.py

JarrentWu1031/SingleInsert

Folders and files

Latest commit

History

Repository files navigation

SingleInsert: Inserting New Concepts from a Single Image to Text-to-Image Models for Flexible Editing

Installation

Mask Preparation

Train

Test

Acknowledgments

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages