Perplexityの画像生成のやり方
Perplexityの画像生成は少し特殊で、何かしら検索した後でしか使えません。
例えば「Perplexityとは」と検索したあと、テキスト生成が終了すると右側に「画像を生成する」という項目が出てきます。
拡大するとこう。
クリックすると、スタイルを選択という画面が出てきて、「絵画」「写真」「イラスト」「図表」が選択できます。いずれかをクリックすると…
例えば、「写真」をクリックすると…
…!?
よくわからない画像が出てきました。
プロンプトを指定して画像を生成させるには、工具マークをクリックします。
[% module(広告) %]
主題の内容が画像生成に使われるプロンプトです。日本語が入っていますが、画像生成には日本語が効かないので、英語で指定し直します。(DALL-E3の場合は日本語が通るぽいです)
スタイルに「photo」、主題に「female use computer at office」と入力しました。
だいたい指定通りの画像が生成されました。
なお、上記の画像が画像生成モデルをDALL-E3に指定しています。
画像生成モデルは、PROに課金していると変更が可能。
設定画面のperplexity proのImage Generation Modelのところから変更できます。
DALL-E3のほか、Playgroundという画像生成AI、Stable Diffusion XL、Flux-1が選択できます。
Stable Diffusionは、デフォルトモデル固定。好きなモデルを使えてこそ強みの出るStable Diffusionなので、面白みはいまいちかも。
画像生成モデルにFLUX.1登場
画像生成モデルにFLUX.1が追加されていました。2024年9月確認。
FLUX.1は、StableDiffusion3発表後に、Stability AI社から離れたチームが作ったモデルと、SD3を超えるクォリティの画像を生成すると言われているモデル。
フォトリアル、アンリアル、イラスト調、アニメ調のどれもいい感じに出してくれますね。
現時点では、Perplexityで使える画像生成モデルとしては一番いいかも。
プロンプトは英語限定ぽいです。
Perplexityの画像生成におけるプロンプト入力のコツ
いちばん大事なのは「英語で」ということでしょうか。
DALLEの場合のみ、日本語でのプロンプトが通りますが、それ以外は意味不明な出力になってしまいます。
プロンプトの基本構造
- スタイルの指定
- 「写真」「イラスト」「絵画」「図表」などの画風を明確に指定します。
- 主題の詳細な説明
- 生成したい画像の内容を具体的に英語で記述します。
効果的なプロンプト作成のポイント
- 明確な指示: 生成したい画像の内容を具体的に説明しましょう。
- コンテキストの提供: 背景情報を含めることで、AIがタスクをより良く理解できます。
- キーワードの活用: 関連する重要な用語を含めることで、より適切な画像生成が可能になります。
- 出力形式の指定: 希望する画像のスタイルや形式を明確に伝えましょう。
プロンプト例
- スタイル: photo
主題: female use computer at office - スタイル: illustration
主題: futuristic cityscape with flying cars - スタイル: painting
主題: serene mountain landscape at sunset
追加のヒント
- 思うような画像にならない場合、プロンプトは英語で入力すると、より良い結果が得られることがあります。
- 1日に生成できる画像数は50枚までです。
- 生成された画像は個人的な非商用利用に限定されています。
- エラーが発生した場合は、不適切な内容がないか確認し、接続の安定性を確保してください。
生成画像は、非商用目的のみ、となってはいるのですが、「詳細については利用規約を」となっており、利用規約には商用利用について触れられていないように見えます。
これはまあ、画像生成AIの出力した画像についてPerplexityがどうこういう権利はなく、オリジナルのDALLEなどのポリシーに従うということでしょうか…。
画像生成LLM指定はPROモードのみ
無料モードでは「PLAYGROUND」というよくわからない画像生成LLMでの生成です。
PROモード(課金)でDALLEなどが使えるようになります。
ただし、1度検索を実行しないと画像が出ないので、画像生成目的には、あまり合わないと思います。
精度面では本家には及ばないものの、ローカルDALLEという選択肢もあります。
関連)DALLE3の使い方/無料で使える?料金やローカル実行は?
バッチ処理で生成しまくるなら、人気モデルをダウンロードしてのStableDiffusionのが全然良いでしょうね。