Perplexityの画像生成のやり方 Pro用プロンプトのコツ

Perplexityの画像生成のやり方

Perplexityの画像生成は少し特殊で、何かしら検索した後でしか使えません。

画像生成モデルにFLUX.1が追加されていました。2024年9月確認。

FLUX.1は、StableDiffusion3発表後に、Stability AI社から離れたチームが作ったモデルと、SD3を超えるクォリティの画像を生成すると言われているモデル。

フォトリアル、アンリアル、イラスト調、アニメ調のどれもいい感じに出してくれますね。

現時点では、Perplexityで使える画像生成モデルとしては一番いいかも。

プロンプトは英語限定ぽいです。

いちばん大事なのは「英語で」ということでしょうか。

DALLEの場合のみ、日本語でのプロンプトが通りますが、それ以外は意味不明な出力になってしまいます。

プロンプトの基本構造

効果的なプロンプト作成のポイント

プロンプト例

追加のヒント

生成画像は、非商用目的のみ、となってはいるのですが、「詳細については利用規約を」となっており、利用規約には商用利用について触れられていないように見えます。

これはまあ、画像生成AIの出力した画像についてPerplexityがどうこういう権利はなく、オリジナルのDALLEなどのポリシーに従うということでしょうか…。

無料モードでは「PLAYGROUND」というよくわからない画像生成LLMでの生成です。

PROモード（課金）でDALLEなどが使えるようになります。

ただし、1度検索を実行しないと画像が出ないので、画像生成目的には、あまり合わないと思います。

精度面では本家には及ばないものの、ローカルDALLEという選択肢もあります。

バッチ処理で生成しまくるなら、人気モデルをダウンロードしてのStableDiffusionのが全然良いでしょうね。