PR

Perplexityの画像生成のやり方

Perplexityの画像生成のやり方

Perplexityの画像生成は少し特殊で、何かしら検索した後でしか使えません。

関連)Perplexityの使い方

例えば「Perplexityとは」と検索したあと、テキスト生成が終了すると右側に「画像を生成する」という項目が出てきます。

拡大するとこう。

クリックすると、スタイルを選択という画面が出てきて、「絵画」「写真」「イラスト」「図表」が選択できます。いずれかをクリックすると…

例えば、「写真」をクリックすると…

…!?

よくわからない画像が出てきました。

プロンプトを指定して画像を生成させるには、工具マークをクリックします。

[% module(広告) %]

主題の内容が画像生成に使われるプロンプトです。日本語が入っていますが、画像生成には日本語が効かないので、英語で指定し直します。(DALL-E3の場合は日本語が通るぽいです)

スタイルに「photo」、主題に「female use computer at office」と入力しました。

だいたい指定通りの画像が生成されました。

なお、上記の画像が画像生成モデルをDALL-E3に指定しています。

画像生成モデルは、PROに課金していると変更が可能。

設定画面のperplexity proのImage Generation Modelのところから変更できます。

DALL-E3のほか、Playgroundという画像生成AI、Stable Diffusion XL、Flux-1が選択できます。

Stable Diffusionは、デフォルトモデル固定。好きなモデルを使えてこそ強みの出るStable Diffusionなので、面白みはいまいちかも。

画像生成モデルにFLUX.1登場

画像生成モデルにFLUX.1が追加されていました。2024年9月確認。

FLUX.1は、StableDiffusion3発表後に、Stability AI社から離れたチームが作ったモデルと、SD3を超えるクォリティの画像を生成すると言われているモデル。

フォトリアル、アンリアル、イラスト調、アニメ調のどれもいい感じに出してくれますね。

現時点では、Perplexityで使える画像生成モデルとしては一番いいかも。

プロンプトは英語限定ぽいです。

Perplexityの画像生成におけるプロンプト入力のコツ

いちばん大事なのは「英語で」ということでしょうか。

DALLEの場合のみ、日本語でのプロンプトが通りますが、それ以外は意味不明な出力になってしまいます。

プロンプトの基本構造

  1. スタイルの指定
    • 「写真」「イラスト」「絵画」「図表」などの画風を明確に指定します。
  2. 主題の詳細な説明
    • 生成したい画像の内容を具体的に英語で記述します。

効果的なプロンプト作成のポイント

  • 明確な指示: 生成したい画像の内容を具体的に説明しましょう。
  • コンテキストの提供: 背景情報を含めることで、AIがタスクをより良く理解できます。
  • キーワードの活用: 関連する重要な用語を含めることで、より適切な画像生成が可能になります。
  • 出力形式の指定: 希望する画像のスタイルや形式を明確に伝えましょう。

プロンプト例

  1. スタイル: photo
    主題: female use computer at office
  2. スタイル: illustration
    主題: futuristic cityscape with flying cars
  3. スタイル: painting
    主題: serene mountain landscape at sunset

追加のヒント

  • 思うような画像にならない場合、プロンプトは英語で入力すると、より良い結果が得られることがあります。
  • 1日に生成できる画像数は50枚までです。
  • 生成された画像は個人的な非商用利用に限定されています。
  • エラーが発生した場合は、不適切な内容がないか確認し、接続の安定性を確保してください。

生成画像は、非商用目的のみ、となってはいるのですが、「詳細については利用規約を」となっており、利用規約には商用利用について触れられていないように見えます。

これはまあ、画像生成AIの出力した画像についてPerplexityがどうこういう権利はなく、オリジナルのDALLEなどのポリシーに従うということでしょうか…。

 画像生成LLM指定はPROモードのみ

無料モードでは「PLAYGROUND」というよくわからない画像生成LLMでの生成です。

PROモード(課金)でDALLEなどが使えるようになります。

ただし、1度検索を実行しないと画像が出ないので、画像生成目的には、あまり合わないと思います。

精度面では本家には及ばないものの、ローカルDALLEという選択肢もあります。

関連)DALLE3の使い方/無料で使える?料金やローカル実行は?

バッチ処理で生成しまくるなら、人気モデルをダウンロードしてのStableDiffusionのが全然良いでしょうね。

関連)stable diffusionの使い方 インストール方法やモデルの配置