【初心者向け】Stable Diffusionの使い方ガイド｜プロンプト入力から高品質画像のコツまで！

画像生成AI

2025.06.182025.07.19

Stable Diffusionの導入はできたけど、「どう使えばいいの？」「プロンプトって何を書けばいいの？」と迷っていませんか

本記事では、Stable Diffusionの基本的な使い方と、初心者が覚えておくと便利なポイントを徹底解説します。

AUTOMATIC1111版のWeb UIをベースに解説していきます！

✅ 目次

起動方法と画面の見方
画像生成の基本（txt2img）
プロンプト入力のコツ
ネガティブプロンプトとは？
解像度・ステップ・CFG Scaleって何？
画像から画像を作る（img2img）
おすすめの初期設定
まとめ

起動方法と画面の見方

Stable DiffusionのWeb UIを起動すると、ブラウザで以下のURLが開きます：

※※.0.0.1:※※※※/　（このIPは仮です）

画面上部に複数のタブがありますが、基本的には以下の2つをよく使います：

txt2img：テキストから画像を生成

img2img：元画像を変化させて新しい画像を生成

画像生成の基本（txt2img）

▼ 手順

上部のタブから「txt2img」を選択
Prompt（プロンプト）に生成したいイメージを英語で入力
必要に応じて「Negative prompt」に除外したい要素を入力
「Generate」ボタンをクリック

数十秒ほどで画像が生成され、下に表示されます。

プロンプト入力のコツ

プロンプトとは、AIへの「指示文」です。英語で詳細に描写するほど、狙った画像に近づきます。

▼ 例：

a beautiful anime girl with long silver hair, wearing a gothic dress, standing in a flower field, ultra detailed, soft lighting

▼ よく使うキーワード

表現説明

anime style アニメ風
ultra detailed 超高精細
masterpiece 芸術的な完成度
fantasy city ファンタジー風の街並み
dramatic lighting 劇的な光の演出

ネガティブプロンプトとは？

「こういう要素は入れないでほしい」という否定指示を出すのがネガティブプロンプトです。

▼ よく使う例：

blurry, low quality, extra limbs, ugly face, bad hands

使うことで画質や表現の安定感がグッとアップします。

解像度・ステップ・CFG Scaleって何？

設定の意味をざっくり理解しておくと、クオリティ調整がしやすくなります。

項目説明

Width / Height 画像の横幅・高さ（通常512×768など）
Steps 画像を生成するステップ数（20～30前後が安定）
CFG Scale テキスト通りに作る度合い（7〜12が推奨）

画像から画像を作る（img2img）

「絵のラフ」や「写真」をベースに新しい画像を作りたいときはimg2imgを使います。

▼ 使い方

「img2img」タブを開く
画像をアップロード
プロンプトを入力（新しいイメージ）
「Denoising strength」（変化の強さ）を調整（0.5〜0.7が自然）
「Generate」で生成！

イラストの清書や、実写→アニメ化にも便利です。

おすすめの初期設定（初心者向け）

以下は安定して画像を出せる、バランスの良い設定例です：

解像度：512×768（縦長）、または768×512（横長）

Steps：25

CFG Scale：8.0

Sampler：DPM++ 2M Karras（自然で安定）

モデル：v1.5系 or 好みのLoRAモデルを選ぶ

まとめ

Stable Diffusionは、プロンプトの工夫次第で自分だけの理想の画像を自由自在に作れるAIツールです。

まずは基本設定で試してみて、少しずつプロンプトやパラメータを調整していくのがおすすめ！

✅ 次に読むべき記事

Stable DiffusionにLoRAを追加する方法

高解像度化（アップスケーラー）の使い方

商用利用や著作権に関する注意点まとめ

コメント

タイトルとURLをコピーしました