生成AIでエッチな画像を作る探求
以前、ChatGPTを使ってアップスケーラーを比較する記事を作りました。

作ったはいいんですが、結局違いが分かりにくいことと、そもそもアップスケーラーを変えたところでそこまで劇的な変化はないことがわかりました。
結局のところ差がつくのは再サンプリング時のサンプラーやスケジューラーです。
ところで再サンプリングには通常のサンプリングのほかにTiled Diffusionを使う方法がありまして、これを使うと非常に書き込みの多い画像が生成できます。
Tiled Diffusionとは
Tiled Diffusionは限られたVRAMで大きな画像を生成したり、アップスケールしたりするためのライブラリです。
簡単に説明すると画像生成時に指定されたサイズを一回で生成するのではなく、指定されたタイルに分割して生成し、結果を結合して最終的な結果を生成します。
このため、指定するタイルのサイズがVRAMに乗りきるサイズであれば画像生成が可能になります。
厳密にはタイルのサイズ=VRAMのサイズではないですがそんな感じだと思ってください
↓Tiled DiffusionのGitHub
この記事ではTiled Diffusionを使ったアップスケールと通常のアップスケールの違いを紹介したいと思います。
アップスケールのパターン
今回、アップスケールの違いを見てもらうため3つのパターンを用意しました。
- 2回に分けたアップスケールでタイルを使用しないパターン
- 2回に分けたアップスケールで2回目にタイルを使用するパターン
- 1回でアップスケールを行いタイルを使用するパターン
それでは早速違いを見てみましょう。
使用するチェックポイントはChikMix_v3です。
修正が面倒なのでパンティーは履いてもらいました
2回に分けたアップスケールでタイルを使用しないパターン




まぁ、これでも普通に綺麗ですよね。
2回に分けたアップスケールで2回目にタイルを使用するパターン




引きだとわかりづらいのですが、バストアップだと顔の書き込みに結構違いがあることが分かると思います。
1回でアップスケールを行いタイルを使用するパターン




一番違いが分かりやすいのがこのパターンです。
ただし、拡大が大きすぎると元画像から乖離するので注意が必要です。2倍くらいなら心配いりません。
スライダで違いを見てみる
こういうのはスライダで見てこそだと思うので用意しました。
最も差が大きい、パターン1とパターン3の比較にしてあります。
まとめ
ポーズのパターンが少なかったりというのはあるのですが、こうしてみるとSD1.5系のモデルはまだまだ現役な感じがあります。
2年前、3年前であれば技術の問題でここまで綺麗なものは出力できなかったのかもしれませんが、どうすればより綺麗に出力できるのかが研究された今、これほどまで精細な画像が出力できます。
ひょっとしたら作者ですらここまでのものが出力されるとは思わなかったのではないでしょうか。
なお、実際にどのようにワークフローを組むかはちょっと長くなるので別途、記事を用意します。
↓ワークフローの組み方を記事にしました



コメント