ネガティブプロンプト

AIにおけるネガティブプロンプトは、モデルに除外すべき要素を指示し、生成画像やテキストから不要な要素を避けることで出力品質を向上させます。

AIにおけるネガティブプロンプトとは?

人工知能(AI)におけるネガティブプロンプトとは、AIモデルに対して生成する出力に含めてほしくない要素を指示する命令です。従来のプロンプトがAIに「何を生成するか」を導くのに対し、ネガティブプロンプトは「避けるべき要素やスタイル、特徴」を指定します。この手法は特にテキストから画像を生成するような生成モデルにおいて、出力内容をコントロールして望ましい結果を得るために有効です。

AIによる画像生成の文脈では、ネガティブプロンプトは特定のオブジェクトやスタイル、望ましくない特徴を除外するのに使われます。ユーザーはネガティブプロンプトを活用することで、生成結果を洗練させ、期待により近いコンテンツを得ることができます。

ネガティブプロンプトの使い方

ネガティブプロンプトは、生成プロセスの中でAIモデルが不要なコンテンツを避けるよう誘導するために使われます。AIシステムにプロンプトを入力する際、ユーザーは除外したい要素をネガティブプロンプトとして追加できます。これは通常、ネガティブプロンプト用の別フィールドに入力するか、特定の構文を使ってポジティブとネガティブの指示を区別して行います。

ネガティブプロンプトの使用手順

  1. ポジティブプロンプトを作成する: まず、AIに生成してほしい内容を説明するプロンプトを書きます。
    例:「日の出の森の中で女性のポートレート」

  2. 除外したい要素を特定する: 画像から排除したいスタイルやオブジェクト、望ましくない特徴を決めます。

  3. ネガティブプロンプトを作成する: 避けたい要素をリストアップしてネガティブプロンプトを書きます。
    例:「ぼやけ、低品質、余分な手足、テキスト、ウォーターマーク、崩れた顔」

  4. 両方のプロンプトをAIシステムに入力する: ネガティブプロンプトに対応したAIツールでは、ポジティブ・ネガティブ両方のプロンプト欄があります。それぞれに入力しましょう。

  5. コンテンツを生成する: AIモデルを実行して出力を生成します。AIは両方のプロンプトを考慮し、望ましい要素を含み指定したネガティブを避けるようにします。

ネガティブプロンプトの使用例

Stable Diffusionで画像品質を向上

ネガティブプロンプトなしの場合:
ユーザーが「高解像度のファンタジーヒーローのポートレート」と入力した場合、AIは画像を生成しますが、余分な指や歪んだ顔といった不要なアーティファクトが含まれることがあります。

ネガティブプロンプトありの場合:
ユーザーが「崩れた顔、余分な手足、ぼやけ、低品質」などのネガティブプロンプトを追加すると、AIはより正確な人体や高品質な画像を生成します。

不要なオブジェクトの除去

シナリオ:
都市のスカイライン画像を生成したいが、汚染やスモッグを除外したい場合。

  • ポジティブプロンプト:「夕暮れ時のクリアな都市スカイライン」
  • ネガティブプロンプト:「スモッグ、汚染、もや」

結果として、環境汚染のない美しい都市景観画像が生成されます。

アートスタイルのコントロール

シナリオ:
写実的な画像を求めており、カートゥーン的要素は避けたい場合。

  • ポジティブプロンプト:「写実的な山の風景画像」
  • ネガティブプロンプト:「カートゥーン、イラスト、コミックスタイル」

AIは写真のようなリアルな画像を生成し、スタイライズされた特徴が排除されます。

ネガティブプロンプトの活用事例

AI生成アートの洗練

Stable DiffusionMidjourneyなどのAIツールを使うアーティストは、ネガティブプロンプトで作品を洗練できます。望ましくない要素を指定することで、プロフェッショナルな基準を満たす高品質な画像を生成できます。

例:
アーティストがテキストやウォーターマークのないコンセプトアートを作成したい場合、「テキスト、ウォーターマーク、ロゴ」をネガティブプロンプトに追加することで、最終画像がクリーンになり使用に適したものとなります。

デザイン・広告での特定コンテンツ生成

広告キャンペーン用のデザインでは、ブランドガイドラインに沿った画像が必要です。ネガティブプロンプトを使うことでブランドイメージに合わない要素を排除できます。

例:
会社のブランディングで特定の色やスタイルを避ける場合、それらをネガティブプロンプトに入力し、AI生成画像がブランドのビジュアルアイデンティティに合致するようにします。

コンテンツモデレーションとコンプライアンス

公開用コンテンツ生成では、不適切または禁止された素材を避ける必要があります。ネガティブプロンプトはそのようなコンテンツのフィルタリングに役立ちます。

例:
すべてのユーザーに適した画像生成のため、「ヌード、暴力、流血、攻撃的なシンボル」などのネガティブプロンプトを追加することで、コンテンツポリシーや社会的基準に適合できます。

テキスト生成モデルの改善

ネガティブプロンプトは画像生成だけでなく、チャットボットのようなテキスト生成モデルにも応用できます。

例:
専門的な医療アドバイスを提供するチャットボットでは、カジュアルな言葉遣いやスラングを避けたい場合。

  • ポジティブプロンプト:「インフルエンザの症状について詳しく説明してください。」
  • ネガティブプロンプト:「スラング、口語、ジョーク」

これにより、チャットボットの応答は専門的かつ適切なものになります。

Stable Diffusionにおけるネガティブプロンプトの理解

Stable Diffusionはテキストプロンプトから画像を生成する人気のAIモデルです。ネガティブプロンプトはStable Diffusionの出力品質向上に特に効果的です。

Stable Diffusionでのネガティブプロンプトの仕組み

ネガティブプロンプトは、画像生成プロセスにおける制約として機能します。AIモデルの拡散過程で、高次元の表現空間内で特定の概念から離れるように導きます。

画像生成時、Stable Diffusionはポジティブプロンプト(含めたい要素)とネガティブプロンプト(避けたい要素)の両方を考慮します。この二重のガイダンスにより、ユーザーの期待により合致した出力が得られます。

ネガティブプロンプトの構文

Stable Diffusionの一部インターフェースでは、ネガティブプロンプトを専用フィールドに直接入力できます。その他では、同じプロンプト欄内で特定の構文を用いて記述する場合もあります。

構文例:

  • ポジティブプロンプト:「レンブラント風の若い女性のポートレート」
  • ネガティブプロンプト:「低品質、ぼやけ、崩れた顔、余分な手足」

Stable Diffusionでの例

ポートレートの改善

ネガティブプロンプトなし:
人物画像に余分な指や歪んだ顔などの異常が生じることがあります。

ネガティブプロンプトあり:
「崩れた顔、余分な手足、バッドアナトミー、歪んだ顔」などをネガティブプロンプトに追加することで、より正確なポートレートが生成されます。

スタイルのコントロール

シナリオ:
未来都市の画像が欲しいが、スチームパンク要素は避けたい場合。

  • ポジティブプロンプト:「空飛ぶ車のある未来都市スカイライン」
  • ネガティブプロンプト:「スチームパンク、ヴィクトリアン、ギア」

結果として、洗練された現代的なイメージが得られます。

効果的なネガティブプロンプトのコツ

ネガティブプロンプトは具体的に

ネガティブプロンプトが具体的であるほど、AIは不要な要素を正確に除外できます。

  • 効果が薄い例:「悪いもの」
  • 効果的な例:「ぼやけ、低品質、ピクセル化、テキスト、ウォーターマーク」

複数のキーワードを組み合わせる

ネガティブ要素を網羅的に記載することで、さらに洗練された出力が得られます。

ネガティブプロンプト例:
「ぼやけ、ピントが合っていない、低解像度、バッドアナトミー、余分な手足、崩れた顔、テキスト、ウォーターマーク」

スタイル排除にも活用

特定のアートスタイルや影響を避けたい場合、それらをネガティブプロンプトに含めましょう。

  • 例:「カートゥーン、アニメ、コミックブック、ローポリ」

過剰な制限に注意

ネガティブプロンプトは強力ですが、多用しすぎるとAIの創造性を制限したり、面白みに欠ける結果になることがあります。AIへの指示と自由のバランスを保ちましょう。

他のAIモデルにおけるネガティブプロンプト

Midjourney

Midjourneyも画像生成に使われるAIモデルで、ネガティブプロンプトに対応しています。

Midjourneyでの使用例:

  • ポジティブプロンプト:「/imagine 夕焼けの静かなビーチ」
  • ネガティブプロンプト:「–no 人物、テキスト、ロゴ」

ChatGPTやテキストモデル

ChatGPTのようなテキスト生成AIモデルでも、ネガティブプロンプトで不要な話題を回避できます。

例:

  • ユーザー:「量子力学について説明してください。」
  • ネガティブプロンプト(暗黙的): AIは個人的見解やセンシティブな話題を避けるよう設計されています。

明示的なネガティブプロンプト入力フィールドがない場合でも、システムレベルの指示で不適切な内容をフィルタリングしています。

よく使われるネガティブプロンプトとその効果

ネガティブプロンプト効果
ぼやけ、低品質、低解像度シャープで高精細な画像を生成するようAIを誘導します。
崩れた顔、バッドアナトミー、余分な手足特に人物やフィギュアで解剖学的に正しい描写を促進します。
テキスト、ウォーターマーク、ロゴ、署名不要なテキストやブランディング要素のない画像となります。
ピクセル化、ザラつきノイズのない滑らかでクリアな画像を目指します。
複製、クローン顔画像内の繰り返し要素や意図しない複製を防ぎます。
カートゥーン、コミック、アニメリアリズムや他の好みのスタイルに集中できるよう特定のアートスタイルを除外します。

シナリオ別ネガティブプロンプトリスト

ポートレート・キャラクター向け

  • ネガティブプロンプト:「バッドアナトミー、余分な手足、崩れた顔、下手な顔、複製、ぼやけ、低品質」

風景向け

  • ネガティブプロンプト:「人物、動物、建物、ぼやけ、白飛び、黒つぶれ、低品質」

商品画像向け

  • ネガティブプロンプト:「テキスト、ウォーターマーク、ロゴ、ぼやけ、反射、影」

アートスタイル排除用

特定のスタイルを除外する場合:

  • ネガティブプロンプト:「カートゥーン、コミックブック、アニメ、印象派、抽象画」

ネガティブプロンプトは、AIに「避けてほしいこと」を指示できる強力な機能です。ネガティブプロンプトを効果的に活用することで、AI生成画像やテキストの品質を高め、ニーズや好みに合った結果を得ることができます。アート作品の洗練、ブランド管理、コンテンツポリシーの順守など、生成AIを使うすべての人にとってネガティブプロンプトは不可欠なツールです。

参考文献

  1. RePrompt: Automatic Prompt Editing to Refine AI-Generative Art Towards Precise Expressions(著:Yunlong Wang、Shuyuan Shen、Brian Y. Lim、公開:2023-03-20)
    本論文は、生成AIモデルがテキストプロンプトにもとづき画像を生成する際、入力テキストの意図した感情文脈をどれほど表現できるかを調査しています。著者らはRePromptという自動的にテキストプロンプトを編集する手法を開発し、AI生成画像の感情表現力、特にネガティブ感情の向上を目指しました。クラウドソーシングによる編集戦略や代理モデルのトレーニングを通じて、テキスト特徴が画像生成に与える影響を分析。シミュレーションとユーザースタディにより、AI生成画像の感情的正確性が大きく向上したことを示しました。
    続きを読む

  2. Redefining Qualitative Analysis in the AI Era: Utilizing ChatGPT for Efficient Thematic Analysis(著:He Zhang、Chuhao Wu、Jingyi Xie、Yao Lyu、Jie Cai、John M. Carroll、公開:2024-05-28)
    本研究はChatGPTのようなAIツールを質的研究プロセスに統合することを探っています。研究者へのインタビューや共同作業を通じて課題を特定し、AIによるテーマ分析を効果的に行うプロンプト設計の枠組みを提案。AIの役割に対する研究者の態度がネガティブからポジティブに変化する様子や、プロンプト設計の重要性、倫理的リスクへの注意喚起が示されています。
    続きを読む

  3. Learning to Prompt in the Classroom to Understand AI Limits: A pilot study(著:Emily Theophilou ほか、公開:2023-09-01)
    本研究は、特にChatGPTのような大規模言語モデルに関するAIの能力への誤解から生じるネガティブな感情に着目しています。AIリテラシー向上のための教育介入の必要性を強調し、AIの限界と効果的なプロンプト戦略を伝えることで、AIに対する否定的態度や恐れを軽減し、よりバランスの取れた見方の醸成を目指します。
    続きを読む

よくある質問

AIにおけるネガティブプロンプトとは?

ネガティブプロンプトは、AIモデルに生成出力に含めないよう指示することで、不要な要素やスタイル、特徴を避け、結果の品質を洗練するための指令です。

生成AIモデルではネガティブプロンプトはどのように使われますか?

ネガティブプロンプトはポジティブプロンプトと組み合わせて使われ、特に画像やテキスト生成で除外したい要素を指定します。これにより出力がユーザーの希望や品質基準により合致します。

ネガティブプロンプトは画像生成とテキスト生成の両方で使えますか?

はい。ネガティブプロンプトはStable DiffusionやMidjourneyのような画像生成モデルでよく使われ、テキスト生成においても特定の話題やスタイル、フレーズを避けるために応用できます。

ネガティブプロンプトはいくつまで組み合わせられますか?

複数のネガティブプロンプトを組み合わせることで出力をより洗練できますが、使い過ぎるとAIが過度に制限され創造性が低下します。用途に合わせて最も重要なネガティブ要素に絞るのが最善です。

すべてのAIモデルがネガティブプロンプトをサポートしていますか?

すべてのAIモデルが明示的なネガティブプロンプトをサポートしているわけではありません。Stable DiffusionやMidjourneyのような高度な生成モデルでは対応していますが、一部のテキストモデルはシステムレベルの指示による間接的な除外のみ対応の場合もあります。

FlowHuntで構築を始めましょう

ネガティブプロンプトでAI出力をより洗練できる方法をご紹介します。FlowHuntを使ってチャットボットを構築し、フローを自動化し、厳密なコントロールで生成結果を向上させましょう。

詳細はこちら

Stable Diffusionモデルにおけるプロンプトの極意:完全ガイド
Stable Diffusionモデルにおけるプロンプトの極意:完全ガイド

Stable Diffusionモデルにおけるプロンプトの極意:完全ガイド

Stable Diffusionモデルで高品質なAI生成画像を作成するためのプロンプト技術を習得しましょう。被写体、スタイル、解像度などの重要要素を活用した効果的なプロンプトの作り方を学びます。段階的な構築、ネガティブプロンプト、キーワードブレンドなどのテクニックも紹介し、最適な結果に導きます。...

1 分で読める
Stable Diffusion AI Art +3
メタプロンプト
メタプロンプト

メタプロンプト

人工知能におけるメタプロンプトとは、大規模言語モデル(LLM)のための他のプロンプトを生成または改良するために設計された高次の指示であり、AIの出力を強化し、タスクの自動化やチャットボット・自動化ワークフローにおける多段階推論の向上を実現します。...

1 分で読める
AI Prompt Engineering +4
Stable Diffusion
Stable Diffusion

Stable Diffusion

Stable Diffusionは、テキストの説明から高品質でフォトリアリスティックな画像を生成する先進的なテキストから画像への生成モデルです。潜在拡散モデルとして、拡散モデルと機械学習を効率的に組み合わせ、与えられたプロンプトに非常に近い画像を生成できる、生成AI分野の大きなブレークスルーです。...

2 分で読める
Stable Diffusion AI +5