- 階層マージを越えた階層マージです
階層マージでは25の階層ごとにマージ比率を変えることができますが、階層もまた複数の要素で構成されており、要素ごとに比率を変えることも原理的には可能です。可能ですが、要素の数は600以上にもなり人の手で扱えるのかは疑問でしたが実装してみました。いきなり要素ごとのマージは推奨されません。階層マージにおいて解決不可能な問題が生じたときに最終調節手段として使うことをおすすめします。
次の画像はOUT05層の要素を変えた結果です。左端はマージ無し。2番目はOUT05層すべて(つまりは普通の階層マージ),以降が要素マージです。下表のとおり、attn2などの中にはさらに複数の要素が含まれます。
要素マージは通常マージ、階層マージ時どちらの場合でも有効で、最後に計算されるために、階層マージで指定した値は上書きされることに注意してください。
Elemental Mergeで設定します。ここにテキストが設定されていると自動的に適応されるので注意して下さい。各要素は下表のとおりですが、各要素のフルネームを入力する必要はありません。
ちゃんと効果が現れるかどうかはprint changeチェックを有効にすることで確認できます。このチェックを有効にするとマージ時にコマンドプロンプト画面に適用された要素が表示されます。
部分一致で指定が可能です。
階層:要素:比率,階層:要素:比率,...
または
階層:要素:比率
階層:要素:比率
階層:要素:比率
カンマまたは改行で区切ることで複数の指定が可能です。カンマと改行は混在しても問題ありません。
階層は大文字でBASE,IN00-M00-OUT11まで指定でます。空欄にするとすべての階層に適用されます。スペースで区切ることで複数の階層を指定できます。
要素も同様でスペースで区切ることで複数の要素を指定できます。
部分一致で判断するので、例えば「attn」と入力するとattn1,attn2両方が変化します。「attn2」の場合はattn2のみ。さらに細かく指定したい場合は「attn2.to_out」などと入力します。
OUT03 OUT04 OUT05:attn2 attn1.to_out:0.5
と入力すると、OUT03,OUT04,OUT05層のattn2が含まれる要素及びattn1.to_outの比率が0.5になります。 要素の欄を空欄にすると指定階層のすべての要素が変わり、階層マージと同じ効果になります。 指定が重複する場合、後に入力された方が優先されます。
OUT06:attn:0.5,OUT06:attn2.to_k:0.2
と入力した場合、OUT06層のattn2.to_k以外のattnは0.5,attn2.to_kのみ0.2となります。
最初にNOTと入力することで効果範囲を反転させることができます。 これは階層・要素別に設定できます。
NOT OUT04:attn:1
と入力するとOUT04層以外の層のattnに比率1が設定されます。
OUT05:NOT attn proj:0.2
とすると、OUT05層のattnとproj以外の層が0.2になります。
elemental用のXY plotを複数用意しています。入力例はsample.txtにあります。
複数の要素マージについてXY plotを作成します。要素同士は空行で区切ってください。 トップ画像はsample.txtのsample1を実行した結果です。
特定の要素について値を変えてXY plotを作成します。pinpoint Blocksと同じことを要素で行います。反対の軸にはalphaを指定してください。要素同士は改行またはカンマで区切ります。
以下の画像はsample.txtのsample3を実行した結果です。
各要素の影響度を差分として出力します。オプションでanime gif、csvファイルを出力できます。gif.csvファイルはoutputフォルダにModelAとModelBから作られるフォルダ下に作成されるdiffフォルダに作成されます。ファイル名が重複する場合名前を変えて保存しますが、増えてくるとややこしいのでdiffフォルダを適当な名前に変えることをおすすめします。
改行またはカンマで区切ります。反対の軸はalphaを使用し、単一の値を入力してください。これは要素の効果を見るのにも有効ですが、要素を指定しないことで階層の効果を見ることも可能なので、そちらの使い方をする場合が多いかもしれません。
以下の画像はsample.txtのsample5を実行した結果です。
モデルの描き込み量や色調を補正します。LoRAとは異なる仕組みを用いています。U-Netの入出力に当たる部分を調整することで画像の描き込みや色調を調節します。
Elemental, AdjustのAdjust欄で設定します。空欄の場合無視されます。 入力は7つの数値をカンマで区切って入力して下さい。
0,0,0,0,0,0
が基本であり、ここから数値をずらすと効果が現れます。
7つの数値は
- 描き込み量/ノイズ
- 描き込み量/ノイズ
- 描き込み量/ノイズ
- コントラスト/描き込み
- 色調1
- 色調2
- 色調3
に対応します。 描き込み量が増えると必然的にノイズも増えることになるので気を付けてください。また、Hires.fix使用時では出力が違って見える場合があるので想定される設定で試すことをおすすめします。 数値は大体5までの値を入れるとちょうど良いはずですがそこはモデルにも依存します。正の値を入力すると描き込みが増えたりします。色調に関しては三種類あり、概ねカラーバランスに対応しているようです。
1.はU-Netの入り口に相当する部分です。ここを調節すると画像の描き込み量が調節できます。ここはOUTに比べて構図が変わりやすいです。マイナスにするとフラットに、そして少しぼけた感じに。プラスにすると描き込みが増えノイジーになります。通常の生成でノイジーでもhires.fixできれいになることがあるので注意してください。2,3はOUTに相当する部分です。
ここを調節するとコントラストや明るさがかわり、同時に描き込み量も変わります。サンプルを見てもらった方が早いですね。
基本的にはattnが顔や服装の情報を担っているようです。特にIN07,OUT03,OUT04,OUT05層の影響度が強いようです。階層によって影響度が異なることが多いので複数の層の同じ要素を同時に変化させることは意味が無いように思えます。 nullと書かれた場所には要素が存在しません。
IN00 | IN01 | IN02 | IN03 | IN04 | IN05 | IN06 | IN07 | IN08 | IN09 | IN10 | IN11 | M00 | M00 | OUT00 | OUT01 | OUT02 | OUT03 | OUT04 | OUT05 | OUT06 | OUT07 | OUT08 | OUT09 | OUT10 | OUT11 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
op.bias | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |||
op.weight | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |||
emb_layers.1.bias | null | null | null | null | null | |||||||||||||||||||||
emb_layers.1.weight | null | null | null | null | null | |||||||||||||||||||||
in_layers.0.bias | null | null | null | null | null | |||||||||||||||||||||
in_layers.0.weight | null | null | null | null | null | |||||||||||||||||||||
in_layers.2.bias | null | null | null | null | null | |||||||||||||||||||||
in_layers.2.weight | null | null | null | null | null | |||||||||||||||||||||
out_layers.0.bias | null | null | null | null | null | |||||||||||||||||||||
out_layers.0.weight | null | null | null | null | null | |||||||||||||||||||||
out_layers.3.bias | null | null | null | null | null | |||||||||||||||||||||
out_layers.3.weight | null | null | null | null | null | |||||||||||||||||||||
skip_connection.bias | null | null | null | null | null | null | null | null | null | null | null | null | ||||||||||||||
skip_connection.weight | null | null | null | null | null | null | null | null | null | null | null | null | ||||||||||||||
norm.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
norm.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
proj_in.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
proj_in.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
proj_out.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
proj_out.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn1.to_k.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn1.to_out.0.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn1.to_out.0.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn1.to_q.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn1.to_v.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn2.to_k.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn2.to_out.0.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn2.to_out.0.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn2.to_q.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.attn2.to_v.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.ff.net.0.proj.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.ff.net.0.proj.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.ff.net.2.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.ff.net.2.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.norm1.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.norm1.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.norm2.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.norm2.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.norm3.bias | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
transformer_blocks.0.norm3.weight | null | null | null | null | null | null | null | null | null | null | ||||||||||||||||
conv.bias | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |||
conv.weight | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |||
0.bias | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | ||
0.weight | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | ||
2.bias | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |
2.weight | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |
time_embed.0.weight | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |
time_embed.0.bias | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |
time_embed.2.weight | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | |
time_embed.2.bias | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null | null |