Otama's Playground

AIで遊んだ結果などをつらつら載せていきます。

【Stable Diffusion】ComfyUIを使って画像生成AIで遊んでみよう【Hires.fix編】

今日はHires.fixという手法を使って画像を高解像度化してみようと思います。Hires.fixはStable Diffusionモデルから生成された画像を高解像度にアップスケールする手法の一つです。この手法を用いることで、短い時間で高画質な画像を生成することが可能になります。

今回の記事では、Hires.fixが何かについて簡単に調べてみた後、実際にComfyUIでHires.fixを使って画像を生成しようと思います。

Hires.fixとは

Stable Diffusionのhires.fixは、概要でも説明した通り生成された画像の高解像度化を目的とした機能です。通常、生成された画像は解像度が比較的低く、ディテールが不足していることがあります。hires.fixは、そのような画像をより高解像度で細部まで鮮明にするための手法です。

処理の流れ

  1. 低解像度画像の生成:
    • 通常の生成プロセスを通じて低解像度の画像を生成します。
  2. アップスケーリング:
    • 特定のアルゴリズムを使って生成された低解像度の画像を高解像度に拡大します。
  3. ディテールの補完:
    • 2の画像に対して、1と同じモデルとプロンプトを使用しimage2imageします。

メリット

  • 高解像度な画像の生成にかかる時間を短縮
  • ディテールが作り込まれた画像を生成

実際にComfyUIでhires.fixを使ってみる

ComfyUIのインストール方法

こちらの記事を参照ください。

otama-playground.com

ワークフローの作成手順

理解のためデフォルトのワークフローから自分で追加していきます

  1. Load Defaultして、ワークフローをデフォルトに戻します
  2. Upscale LatentノードとKSamplerノードを追加します
  3. 図のようにつなげます
    • 右側KSamplerのmodel, positive, negativeは左側KSamplerモデルが繋いでるノードと同じノードにつなぎます

hires.fix部分のみ

最終的なワークフロー

生成手順

  1. upscale latentノードの幅と高さをEmpty Latent Imageノードで設定している幅と高さより大きく設定する
    • 今回はとりあえず1024x1024に設定しました
  2. その他モデルやプロンプトなどを好きに設定してQueue Promptを押す。

生成された画像

以下にhires.fix前後の画像を貼っておきます。特に目の部分が顕著ですが、高解像度化しながらディテールも追加されているのがわかると思います。

hires.fix前

hires.fix前

hires.fix後

hires.fix後

最後に

実際に作成してみたワークフローを見るとHires.fixの処理の流れが見えてきます。

  1. まず、一個目のKSamplerで低解像度の画像を生成する。
  2. 次に、Upscale Latentでアルゴリズム(upscale_method)を使って解像度を上げる。
  3. 最後に、2で作成した画像を入力として、2個目のKsamplerで高解像度の画像を新しく生成する。

前の項で説明した通りの流れになっていることがわかると思います。このようにワークフローから仕組みが見えてきやすいのが、ComfyUIを使うメリットの一つだと思っています。

画像生成に関連する他のテクニックを試したい方は下記のリンク集をぜひご活用ください。

otama-playground.com