Stable Diffusion Forge「img2img」の使い方|設定値の解説からInpaintで顔・背景を修正する方法まで

当ページのリンクには広告が含まれています。
スポンサーリンク
目次

はじめに

txt2imgで、ようやく「いい感じの画像」が生成できるようになってきました。

でも、こんなことを感じたことはないでしょうか。

  • もう少し背景だけ変えたい
  • 顔はいいのに、手だけ崩れてる…
  • ラフ画を元に、本格的な絵に仕上げたい

そのもどかしさを解決するのが、img2imgです。

txt2imgが「ゼロから画像を作る」機能なら、img2imgは「既存の画像を素材にして、AIと一緒に育てる」機能です。一度生成した画像を、さらに自分好みに仕上げるための、もう一段階上のツールです。

この記事では、Stable Diffusion Forgeの img2imgタブを使って、RTX 5070環境で実際に試しながら、設定値の意味から実践テクニックまでを丁寧に解説していきます。

このシリーズの関連記事

img2imgとは?txt2imgとの違いを理解する

「ノイズ」の使い方が根本的に違います

txt2imgは、完全なランダムノイズからスタートして、プロンプトに従いながら画像を作り上げていきます。いわば「白紙に絵を描く」プロセスです。

一方img2imgは、アップロードした画像にノイズを乗せてから、同じようにノイズ除去しながら画像を生成します。元の画像の構図や色味を「記憶」した状態でAIが動くため、ゼロからではなく元画像をベースに変換・改造できるのが最大の特徴です。

img2imgでできること

やりたいことimg2imgでの活用法
生成画像の雰囲気を変えたい同じ構図で別スタイルに変換
手や顔だけ修正したいInpaintで部分的に再生成
ラフ画を仕上げたいラフをアップロードして清書
解像度を上げながら加筆したいHires.fixとの併用

img2imgの設定値を理解する

最重要パラメータ:Denoising Strength(ノイズ除去強度)

img2imgを使いこなす上で、最初に理解すべき設定値がこれです。
Denoising Strengthは「元画像をどれだけ変えるか」を0〜1の数値で決めるパラメータです。

数値挙動使いどころ
0.1〜0.3元画像にほぼ忠実。微妙なタッチ調整色味・質感だけ変えたいとき
0.4〜0.65バランス型。構図は残しつつ雰囲気が変わる最も汎用的な範囲
0.7〜0.85大きく変化。プロンプトの影響が強くなるスタイル変換・大幅な改造
0.9〜1.0ほぼtxt2imgと同等。元画像の面影は薄い構図のヒントだけ借りたいとき

筆者の実感として、0.5〜0.65あたりが「元画像を活かしつつ、いい感じに変化する」スイートスポットです。RTX 5070環境であれば、数値を変えながら複数枚同時生成して比較するのがおすすめです。

Resize Mode(リサイズモード)

アップロードした画像のサイズがForgeの出力サイズと異なる場合に、どう調整するかを選ぶ設定です。

Resize Mode(リサイズモード)
  • Just resize(そのまま引き伸ばす)
    元画像をそのまま指定サイズに引き伸ばします。縦横比が変わるため、正方形の画像を横長にすると人物が横に伸びます。元画像と出力サイズが同じ場合はこれで問題ありません。
  • Crop and resize(切り抜いてリサイズ)
    縦横比を維持したままリサイズし、はみ出た部分を切り抜きます。構図の一部が切れても良い場合に使います。
  • Resize and fill(余白を生成)
    縦横比を維持しつつ、足りない部分をAIが自動補完します。余白を自然に埋めてほしいときに便利ですが、補完部分の品質はプロンプト次第です。
  • Just resize (latent upscale)(潜在空間でリサイズ)
    潜在空間上で処理するため高品質ですが、処理が重くなります。上質な変換が必要なときに試してみてください。

初心者向けおすすめ
基本はJust resizeでOKです。出力サイズを元画像に合わせておけば、縦横比の問題は起きません。


CFG ScaleとSteps

基本的な考え方はtxt2imgと同じですが、img2imgでは少し意識が変わります。

CFG ScaleはDenoising Strengthと連動して考えるのがポイントです。Denoisingを高め(0.7以上)にする場合、CFG Scaleも少し高め(7〜9)にするとプロンプトへの追従性が上がります。逆にDenoisingが低め(0.4以下)のときはCFG Scaleを下げ気味(5〜6)にすると元画像の自然さが保たれます。

Stepsはtxt2imgと同じ20〜30で十分です。Denoising Strengthが低い場合は少なめのステップ数でも十分な品質が出ます。

Inpaintで顔を固定・背景や服装を自在に修正する

Inpaintとは何か

img2imgの通常モードが「画像全体を変換する」のに対して、Inpaintは「塗った部分だけを再生成する」機能です。

たとえばこんな場面で活躍します。

  • 顔はパーフェクトなのに、手だけ崩れている
  • 背景だけ別の場所に変えたい
  • 服装だけ変えて、同じキャラクターの別バージョンを作りたい

Forgeのimg2imgタブで「Inpaint」を選ぶと、画像にブラシで直接マスク(白い塗り)を描けるようになります。白く塗った部分だけがAIに再生成され、塗っていない部分は保護されます。

Inpaintの主要設定値

Mask Blur(マスクのぼかし)

マスクの境界線をどれだけぼかすかを決める設定です。

数値挙動
0〜2境界がシャープ。修正部分が浮きやすい
4〜8自然になじむ。初心者はここから始めるのがおすすめ
10以上境界が広くぼける。周辺への影響が大きくなる

境界が不自然に浮いて見える場合は、まずMask Blurを上げてみてください。

Mask mode(マスクモード)

選択肢挙動使いどころ
Inpaint maskedマスク部分を再生成通常はこちら
Inpaint not maskedマスク以外を再生成人物を固定して背景を変えるときに有効

「顔を固定して背景だけ変えたい」場合は、人物全体にマスクを塗って「Inpaint not masked」を選ぶと、塗った部分(人物)が保護され、背景だけが再生成されます。

Masked content(マスク内の初期コンテンツ)

再生成を始める前に、マスクされた部分をどんな状態にしてからAIに渡すかを決める設定です。同じプロンプト・同じDenoising Strengthでも、ここの選択で結果が大きく変わります。

選択肢挙動使いどころ
fill周囲の色で塗りつぶして生成背景を完全に別物にしたいときなど
original元画像を保持して生成迷ったらoriginal一択
latent noiseランダムノイズから生成上級者向け。予測不能な結果になりやすい
latent nothing無の状態から生成実験的。ほぼlatent noiseと同用途

Inpaint Area(再生成の範囲)

選択肢挙動使いどころ
Whole picture画像全体を参照して再生成背景など広い範囲を修正するとき
Only maskedマスク部分を拡大して再生成顔・手など細かい部分の修正に最適

顔の修正には「Only masked」を強くおすすめします。 マスク部分を拡大処理するため、細部の品質が格段に上がります。

Only masked padding(余白ピクセル数)

Only maskedを選んだときに、マスク周辺の何ピクセルを参照するかを決めます。デフォルトの32ピクセルで大半の場合は問題ありません。 修正部分が周囲となじまない場合は、64程度に上げてみてください。

Denoising Strength(Inpaint時)

Inpaintでも同じDenoising Strengthが効きますが、通常のimg2imgより低めに設定するのが基本です。

数値挙動
0.3〜0.5元の雰囲気を残しつつ修正。違和感が出にくい。
0.6〜0.75大きく変えたいとき。服装変更などに。
0.8以上ほぼ別物になる。背景を全く変えるときなど。

顔の修正なら0.4前後から試すのがおすすめです。変化が強すぎると別人になります。

実践①:顔を固定して背景だけ変える手順

STEP
img2imgタブで「Inpaint」を選択します
STEP
生成済みの画像をアップロードします
STEP
ブラシで人物全体を白く塗ります
STEP
プロンプトに変えたい背景を記述します

(例:Japanese garden, cherry blossom trees in full bloom, falling cherry petals, dramatic sunset

STEP
設定
  • Resize mode:Crop and resize
  • Mask Blur:6
  • Mask mode:Inpaint not masked
  • Masked content:original
  • Inpaint Area:Whole picture
  • Denoising Strength:0.75
STEP
Generateボタンをクリックして生成します

txt2imgの画像

Inpaintした画像

人物の輪郭ギリギリまで丁寧にマスクを塗るほど、境界が自然に仕上がります。RTX 5070であればBatch Countを4にして一度に複数枚比較するのが効率的です。


実践②:服装だけ変える手順

STEP
img2imgタブで「Inpaint」を選択します
STEP
生成済みの画像をアップロードします
STEP
服装部分だけをブラシで塗ります
STEP
プロンプトに着せたい服を記述します

(例:wearing an elegant off-the-shoulder blouse,matching lavender high-waisted midi skirt)

STEP
inpaintの設定
  • Resize mode:Crop and resize
  • Mask Blur:4
  • Mask mode:Inpaint masked
  • Masked content:original
  • Inpaint Area:Only masked
  • Denoising Strength:0.65
STEP
Generateボタンをクリックして生成します

txt2imgの画像

Inpaintした画像

注意点
服の変更は体のラインに影響が出やすいです。Denoisingを上げすぎると体型まで変わることがあるので、0.65あたりを上限の目安にしてみてください。

全設定値リファレンス表(img2img / Inpaint)

太字が初心者向け推奨値です。

【img2img】通常モード

設定値選択肢/値役割備考
Resize modeJust resize元画像をそのまま引き伸ばす出力サイズを元画像に合わせるならこれでOK
Crop and resize縦横比を維持して切り抜く構図の一部が切れても良い場合に
Resize and fill余白をAIで補完する縦横比を変えたいときに有効
Just resize
(latent upscale)
潜在空間で高品質にリサイズ高品質だが処理が重い
Soft inpaintingON / OFF境界を自動的に柔らかくするONにすると境界がなじむが処理が重くなる
Sampling MethodDPM++ 2M など生成アルゴリズムtxt2imgと同じ設定でOK
Schedule TypeKarrasサンプリングスケジュールアニメ調の画像生成に最適
Sampling Steps20〜30生成の反復回数Denoisingが低い場合は少なめでも十分
Width / Height元画像に合わせる出力解像度RTX 5070なら高解像度も余裕
Batch Count1〜4連続生成回数RTX 5070なら4枚同時比較がおすすめ
Batch Size1同時生成枚数VRAMと相談
CFG Scale5〜9プロンプト追従度Denoising Strengthと連動して調整
Denoising Strength0.5〜0.65元画像からの変化量最重要。まずここだけ覚えればOK
Seed-1(ランダム)生成の乱数再現したい場合は固定

【Inpaint】専用設定値

設定値選択肢/値役割備考
Mask blur4〜8マスク境界のぼかし量低すぎると境界が浮く。まず6から試す
Mask modeInpaint maskedマスク部分を再生成通常はこちら
Inpaint not maskedマスク以外を再生成人物を固定して背景を変えるときに有効
Masked contentoriginal元画像を保持して生成迷ったらoriginal一択
fill周囲の色で塗りつぶして生成修正部分を完全に別物にしたいとき
latent noiseランダムノイズから生成上級者向け。予測不能な結果になりやすい
latent nothing無の状態から生成実験的。ほぼlatent noiseと同用途
Inpaint areaWhole picture画像全体を参照して再生成背景など広い範囲の修正に
Only maskedマスク部分を拡大して再生成顔・手など細部の修正に最適
Only masked padding32pxマスク周辺の参照範囲なじまない場合は64に上げる
Soft inpaintingON / OFF境界を自動的に柔らかくするONにすると自然になじむが処理が重くなる
Denoising Strength0.4〜0.5(顔・手)マスク内の変化量顔修正は低めから試す
0.6〜0.75(服・背景)背景変更は高めに設定

まとめ:img2imgで画像を「育てる」感覚を身につけましょう

txt2imgが「ゼロから画像を生み出す」工程だとすれば、img2imgは「生み出した画像を自分好みに仕上げていく」工程です。

最初は設定値の多さに戸惑うかもしれませんが、実際に触ってみると意外とシンプルです。まず覚えるべきはたったひとつ、Denoising Strengthだけです。この数値を上げ下げするだけで、img2imgの感覚は一気につかめてきます。

Inpaintも同様で、最初は「背景だけ塗って再生成する」という一番シンプルな使い方から始めてみてください。「顔はそのままに、背景だけ別世界に変わった」という体験を一度でもすると、使い方のイメージが一気に広がるはずです。

設定値の全体像は、上記のリファレンス表をブックマークしておいてください。慣れてきたら少しずつ触れる項目を増やしていくのがおすすめです。

このシリーズの関連記事もあわせてどうぞ。

この記事が気に入ったら
フォローしてね!

シェアしていただけると励みになります
  • URLをコピーしました!
  • URLをコピーしました!
目次