Bardの画像生成（Gemini） Imagen2の精度は？SynthIDで透かし

bard（Gemini）の画像生成

Googleの対話型AI「Bard」（現在は「Gemini」に名称変更）では、2024年2月のアップデートで画像生成機能が追加されました。…が、現在、画像生成はできませんでした。（2024年4月）

Imagen 2の画像生成精度は非常に高く、従来の画像生成AIを上回るレベルだと評価されています。

現時点では、画像を生成させようとすると、「画像生成能力の向上のため努力しています…」というようなメッセージが出て、画像は出てきませんでした。

うーん…。前評判としては、以下のような感じになります。

高い写実性と詳細度
Imagen 2は、テキストプロンプトから非常に写実的で詳細な画像を生成できます。人間が手で描いたり撮影したりした画像と遜色ない品質を実現しています。

複雑なプロンプトへの対応力
Imagen 2は、複雑で具体的な指示を含むプロンプトでも、その内容を忠実に画像化できる高い言語理解能力を持っています。従来の画像生成AIでは難しかった表現も可能になりました。

DALL-E 2を上回る生成品質
DrawBenchというベンチマークで人間評価を行った結果、Imagen 2の生成画像の品質はDALL-E 2を上回るスコアが出ています。

SynthIDは、GoogleのAI研究部門DeepMindが開発した、AIで生成された画像に肉眼では見えない電子透かしを埋め込み、その透かしを検出して生成された画像かどうかを識別できるツールです。

主な特徴

目的

提供状況

ただ、これはあまり広まらないんじゃないかなという気はします。画像を公開する側に、これを使うメリットがあまりないですからね…。

Googleとしては、Imagen2に絶対の自信があって、「リアルすぎてフェイクニュースに使われまくるだろうから、予防措置としてSynthIDを埋め込んでおこう」という意図があったんじゃないかと思います。