DALLE3の使い方
DALL-E 3の使い方は以下の通りです。
DALL·E 3(公式サイト)
- ChatGPT PlusやMicrosoft Bing Image Creatorにアクセスし、アカウントにログインする
- 生成したい画像の内容を詳細にテキストで入力する(プロンプト)
具体的で詳細なプロンプトほど、意図した画像が生成されやすい
「夜空に輝く満月とその周りを飛ぶ3匹のコウモリ」のように、ニュアンスまで伝えると良い - 必要に応じて、画像のサイズやスタイルなどのパラメーターを指定する
正方形(1024×1024)、横長(1792×1024)、縦長(1024×1792)から選択可能
stylizeやweirdなどのパラメーターで、画風をカスタマイズできる - 生成された画像のURLから画像を確認・ダウンロードする
- 生成された画像が意図と異なる場合は、ChatGPTでフィードバックを伝えて微調整する
DALLE-3の特徴
DALL-E 3は、前モデルから大幅に進化した高性能な画像生成AI。ユーザーのアイデアを正確に理解し表現できることがが特徴です。
ChatGPTへの統合
DALL-E 3はChatGPTを基盤としており、ChatGPT内で利用可能。ChatGPT Plusや企業向けプランで提供されています。
高い画像生成能力
以前のモデルと比べ、ニュアンスやディテールの理解力が大幅に向上しています。具体的で詳細なプロンプトを与えると、アイデアを忠実に再現した画像を生成できます。
一般的な画像生成AIが、「実在する画像」が得意なのに対して、DALL-E 3は夢の光景や想像上の生物など、実在しないものや抽象的なもの対して画像生成できることが長所です。
日本語プロンプトへの対応
DALL-E 3は日本語のプロンプトにも対応しており、日本語で詳細な指示を与えられます。
パラメーターによるカスタマイズ
画像のサイズやスタイル、奇妙さなどをパラメーターで指定可能です。ユーザーの意図に合わせて生成画像をカスタマイズできます。
DALL-E2とDALL-E3の違いは?
DALL-E 3はDALL-E 2と比べて、生成画像のクオリティが向上し、プロンプトの解釈能力が向上しています。また、ChatGPTやBingとの統合により利便性が増し、無料で使えるようになりました。
画像のクオリティ
DALL-E 3で生成された画像は、DALL-E 2と比べてより鮮明で詳細になっています。同じプロンプトでも、DALL-E 3の方がハイクオリティな画像を生成できます。
テキストプロンプトの解釈
DALL-E 3は、特に長いプロンプトや複雑な指示に対して、より正確に画像を生成できるようになりました。与えられたテキスト情報を忠実に画像に再現する能力が向上しています。
ChatGPTとの統合
DALL-E 3はChatGPT上で使えるようになりました。ChatGPTの有料プランに契約していれば、DALL-E 3を利用できます。
関連 ChatGPTの使い方
検索エンジンとの統合
DALL-E 3はBing Image Creator上でも利用可能になりました。
無料利用
DALL-E 3は無料で利用できます。
DALL-E 3が使える他のサービス
以下のサービスでは、DALL-E3が有料プランで使えます。
- Perplexity(AI検索エンジン)
- Poe(チャットボット作成サービス)
DALL-E3の料金
DALL-E 3の利用にはChatGPT Plusの有料プランへ加入、もしくはAPI利用時の従量課金が必要となります。また、Microsoftのサービス経由だと無料で使用可能です。
MicrosoftのBing Image CreatorやCopilotでDALL-E 3を利用する場合は無料で使えます。
ChatGPTでDALL-E 3を利用する場合は、ChatGPT Plusの月額20ドルプランに加入する必要があります。追加の料金は不要。
DALL-E 3のAPIを直接利用する場合、生成する画像の画質とサイズによって4つの料金プランがあります。
- 標準画質(Standard)・1024×1024ピクセル:1枚あたり$0.040
- 標準画質(Standard)・1024×1792ピクセル(または1792×1024ピクセル):1枚あたり$0.080
- 高画質(HD)・1024×1024ピクセル:1枚あたり$0.080
- 高画質(HD)・1024×1792ピクセル(または1792×1024ピクセル):1枚あたり$0.120
APIでは画像1枚生成ごとに課金され、1回のリクエストで複数の画像は生成できません。日本円だと1枚あたり約6円~18円の料金となります。
PerplexityのPROモード(月額:20ドル)でも、DALL-E3が使えるようになりました。無制限に生成が可能です。
DALL-E3をローカルで動かすことはできる?
しかし、OpenDalleというオープンソースの画像生成AIはローカル環境で動かし、無料でDALL-E 3に近い高品質の画像生成が行えるようになります。
▲OpenDalleで生成した画像
- OpenDalleはオープンソースのため、無料で利用可能
- Stable DiffusionのWebUIから実行可能
- モデルサイズは6.94G。ある程度のスペックのPCが必要
- ライセンスは、非商用個人向けとなっている
まず、StableDiffusionのWebUI(Automtic1111やFooocusなど)をインストールします。
以下からOpenDalleのモデルデータをダウンロードして、モデルデータの格納フォルダに保存します。
Fooocusの場合は、以下のフォルダ(Windowsの場合)
<インストールフォルダ>\Fooocus\models\checkpoints
関連 dataautogpt3/OpenDalle at main (OpenDalleのモデルデータ)
ファイルは、OpenDalle.safetensorsというファイル名です。
OpenDalleをローカルで動かすことで、無料でDALL-E 3に近い高品質の画像生成が行えるようになります。プロンプトへの忠実さが高く、未学習のシチュエ―ションでも画像の反映されやすいため、ユニークな画像を作れるのが魅力です。
DALL-E3のまとめ
- DALL-E3は、OpenAIの画像生成AI
- Bing Chat経由なら無料で使える
- OpenDalleという非公式オープンソース版があり、ローカル環境で動作可能