Stable Diffusionで画像を生成して「なんかボヤっとしてる…」「小さくて粗い」と感じたことはありませんか?
今回は、そんな悩みを解消するために、画像のクオリティを底上げする必須テクニックをまとめて紹介します。
✅ 目次
- 画像クオリティとは?チェックポイント解説
- Hires.fix(高解像度補正)の使い方
- Sampling steps・CFGなどの設定値のコツ
- アップスケーラーの選び方と効果
- 構図と解像度の関係
- 顔・手の破綻を防ぐ方法(VAE・顔修正)
- まとめと次回予告
- 画像クオリティとは?チェックポイント解説
画像の「クオリティが高い」とは、たとえばこんな状態:
解像度が大きい(1024px以上)
ボケてない、ノイズが少ない
顔・手・背景に破綻がない
ライティング(光の演出)が自然
単にプロンプトを変えるだけでなく、設定や技術的な工夫でも大きく変わります!
- Hires.fix(高解像度補正)の使い方
🔧 Hires.fixとは?
Stable Diffusionの「txt2img」画面にあるオプション。
一度小さい画像を生成 → それを高解像度で再生成して画質を上げます。
💡 設定例:
項目 値の目安
Upscale by 1.5〜2.0倍
Hires steps 15〜25
Denoising strength 0.3〜0.55(0.4前後が安定)
Upscaler Latent, ESRGAN, R-ESRGANなど
Denoising strengthが高すぎると、画像が変わりすぎて崩れるので注意!
- Sampling StepsとCFG Scaleのコツ
🌀 Sampling Steps(描画の丁寧さ)
初期:20〜30くらいでOK
詳細に描かせたい場合:40以上も有効だが、時間がかかる
🔁 CFG Scale(プロンプトの忠実度)
目安は 6〜9
高すぎると破綻(AIが頑張りすぎて崩れる)
- アップスケーラーの選び方
Hires.fixやimg2img時に指定できる「アップスケーラー」は重要です。
アップスケーラー名 特徴
Latent 軽量・安定だがややぼんやり
R-ESRGAN 4x シャープ&高品質
4x-AnimeSharp アニメ系におすすめ
SwinIR ノイズ抑制・リアル系に強い
※アップスケーラーは「extensions」や「models/ESRGAN」から追加可能
- 構図と解像度の関係
🖼 解像度によって「構図」が変わる!
横長(1024×768)→ 背景が広がる
縦長(768×1024)→ 全身が写りやすい
正方形(768×768)→ 顔アップに適している
💡狙った構図があるなら、解像度+プロンプトでバランスをとろう!
- 顔・手の破綻対策:VAEと顔修正
✅ VAE(色味・安定性改善)
.vae.safetensors をダウンロードして
models/VAE フォルダへ保存
WebUIの設定から明示的に選択(例:vae-ft-mse-840000)
👤 顔修正機能(顔だけ再描画)
txt2imgやimg2img画面で「Restore faces」にチェック
リアル寄りモデルでの破綻修正に有効(効果はモデル次第)
- まとめと次回予告
高画質化は、プロンプトだけでなく設定・ツールの使い方次第で大きく変わります。
最初は設定を少しずつ変えて試しながら、自分好みのクオリティを探してみましょう!
🔜 次回予定(第5回)
「ControlNetの使い方入門」
→ ポーズ、線画、構図の自由度が劇的に上がる神機能を解説!
コメント