Nano Banana Pro(Gemini 3 Pro Image)を徹底解説

記事タイトルとURLをコピーする

G-gen の川村です。この記事では、Google の画像生成 AI モデルである Gemini 3 Pro Image、通称 Nano Banana Pro について紹介します。

はじめに

当記事について

2025年8月26日、Google は画像生成 AI モデル Gemini 2.5 Flash Image、通称 Nano Banana(ナノバナナ)を発表しました。その後、2025年11月20日に後継モデルである Gemini 3 Pro Image、通称 Nano Banana Pro(ナノバナナプロ)がリリースされました。

当記事では、Nano Banana Pro の基本機能、開始方法、プロンプトのコツ、および実務でのユースケースについて解説します。なお、モデルの正式名称は Gemini 2.5 Flash Image や Gemini 3 Pro Image ですが、当記事ではより広く知られている通称である Nano Banana や Nano Banana Pro を呼称として使用します。

Nano Banana Pro とは

Nano Banana Pro とは、Google が提供する画像生成・編集 AI モデルです。

前身の Nano Banana は、LM Arena(AI モデルを評価する公開ウェブサイト)の提出時に仮の名前としてつけられたものが、その精度の高さから話題となり、現在では Google 公式の通称として定着しています。

Nano Banana Pro は以下のような特徴により、従来の画像生成 AI の弱点を克服しています。

特徴 説明
被写体の一貫性 生成した人物やオブジェクトの特徴を保持したまま、異なるシーンやポーズで展開
対話型編集 自然言語(プロンプト)での指示により、画像の特定部分を段階的に修正・変更可能
高速処理 通常の画像生成 AI が30秒〜1秒程度かかるのに対し、数秒〜30秒程で生成を完了できる高速性

Nano Banana と Nano Banana Pro

Nano Banana Pro が高性能を発揮する一方で、Nano Banana は速度と効率性を重視して設計されており、大容量かつ低レイテンシ(低遅延)のタスクに最適化されています。また API 経由での利用時は、利用料金も Nano Banana のほうが安価に設定されています。

なお Gemini アプリ内では、Nano Banana が「高速モード」に割り当てられており、手軽に画像生成したい時や、試行錯誤を繰り返したい場合に適しています。一方で Nano Banana Pro は「思考モード」「Pro」に割り当てられています。

Nano Banana と Nano Banana Pro のスペックの違いについては、以下の表を参照してください。

機能 Nano Banana Nano Banana Pro
解像度 最大 1024×1024px(1K) 2K/4K対応(最大4096×4096px)
テキスト描写 一部歪みが発生する場合あり 高精度、多言語対応(日本語含む)
参照画像合成 最大3枚を推奨 最大14枚(人物 5 名、オブジェクト6個を含む)
推奨タスク 高速な試行錯誤、低レイテンシの環境 プロ仕様の制作、複雑な対話型編集

Nano Banana Pro の利用

概要

Nano Banana Pro は、Gemini アプリ、NotebookLM、Google スライド、Google Vids など、Google Workspace に付属のアプリで使用できます。また、個人向けの Gemini アプリでも利用可能です。

また、Google Cloud や Google AI Studio を使うことで、API 経由での呼び出しも可能なことから、独自開発のアプリに組み込むことも可能です。

Google Workspace での利用

Nano Banana Pro は多くの Google Workspace エディションで利用可能ですが、一部機能は Business Standard 以上のプランに限定されています。

Google Workspace エディション Gemini アプリ / NotebookLM Google スライド Google Vids 1日の画像生成上限
Business Starter / Enterprise Starter △ (注1) 3枚
Business Standard / Plus 100枚
Enterprise Standard / Plus 100枚
Google AI Ultra for Business 1,000枚

(注1) Google Vids では、Business Starter 等の下位プランでも 2026 年 5 月末まで期間限定で利用可能です。ただし、それ以降はAI機能の使用に制限が設けられる可能性があります。

その他のエディションや詳細については、以下公式ドキュメントを参照してください。

API 経由での利用

Google Cloud の AI プラットフォームサービス Vertex AI や、個人向けの生成 AI プラットフォームサービス Google AI Studio を使うことで、Nano Banana Pro を API 経由で呼び出すことができます。

これにより、自組織で独自開発したアプリケーションに、Nano Banana Pro による画像生成機能を組み込むことが可能です。

Vertex AI と Google AI Studio の違いについては、以下の記事を参照してください。

blog.g-gen.co.jp

特徴

解像度と画質

従来の Nano Banana の解像度上限は 1024 × 1024 ピクセル(1K)でしたが、Nano Banana Pro は最大 4K(4096 × 4096ピクセル)でのネイティブ生成に対応しています。

このネイティブ生成とは、単に小さな画像を引き伸ばすではなく、最初から高解像度で画像を生成することを意味しています。高解像度のため、印刷物や大型ディスプレイでの利用時に優位性があります。ただし、現時点では 4K での生成は API 経由での呼び出し時のみとなっている点には注意が必要です。

日本語テキスト描写

AI 画像生成における「文字崩れ」や「日本語に弱い」といった課題が、Nano Banana Pro で劇的に改善されました。

ロゴや看板、ポスターなどの画像内に、ひらがな、カタカナ、漢字を正しく、かつデザインに馴染んだ形で挿入できます。

思考モード

Nano Banana Pro では、画像生成する前に、「思考モード」という推論プロセスを踏みます。

この思考モードにより、ユーザーの指示の背景にある「意図」や「文脈」まで整理してから画像を生成します。よって、複雑な指示でも乖離が少ない結果が得られます。

Google 検索との連携

Nano Banana Pro は Google 検索ツールと連携し、リアルタイムの情報を画像に反映できます。

これにより、最新のニュースや天気、株価などのデータに基づいた視覚資料の作成が可能です。

利用手順

Gemini アプリ

  1. Gemini アプリ(https://gemini.google.com/app)にアクセス
  2. 「画像を作成」(画像①)を選択
  3. モデルメニューから「思考モード」(画像②)を選択(「高速モード」は Nano Banana (gemini-2.5-flash-image) を使用)
  4. プロンプトを送信

NotebookLM

  1. NotebookLM(https://notebooklm.google.com)にアクセス
  2. ノートブックを開いて「ソースを追加」を選択し、ソースをアップロード
  3. 「インフォグラフィック」をクリック

その他

以下のサービスからも、Nano Banana Pro を使用できます。詳細な手順は省略します。

  • Google スライド
  • Google Vids
  • Vertex AI
  • Google AI Studio

プロンプトのコツ

概要

Nano Banana Pro の性能を引き出すには、以下のような要素を組み合わせることが有効です。

要素 説明
被写体 誰、何が 小さな柴犬、キャップを被った男性
場所 / 背景 どんな場面、環境か 雪が舞っている森林、夕暮れのビーチ
アクション 何をしているか、状態 勢いよく走っている、座っている
スタイル 表現手法 アニメ風、80年代風

被写体のシーン変更

最大 5 人までの人物やキャラクターを一貫して維持しつつ、異なるポーズやシーン、表情の画像を複数生成できます。

プロンプト例

この人物が、おしゃれなカフェでノートPCを開いて作業している様子

対話による段階的編集

被写体を維持したまま自然言語で画像を編集できます。また、会話形式で段階的にリッチな画像を作り上げていくことができます。

プロンプト例(初回)

背景を夜景にして

プロンプト例(2回目)

空に大きな花火を打ち上げて

複数画像の統合

最大 14 枚の異なる参照画像(人物、商品、背景など)の要素を組み合わせて、新しい画像を生成します。例えば、自社商品画像と背景画像を組み合わせて広告写真を作成できます。

プロンプト例

このスニーカーが、森の岩の上に自然に置かれている広告写真を作って

文字の挿入

ロゴやポスター、インフォグラフィックなどに、日本語(漢字・ひらがな・カタカナ)を含む正確なテキストを組み込むことができます。

プロンプト例

レトロな喫茶店の木製看板に、『純喫茶 ジージェン』と手書き風の日本語フォントで描いて

高解像度出力

Nano Banana Pro は最大 4K 解像度での画像生成をサポートし、印刷物や大型ディスプレイ向けのプロフェッショナルで高画質な画像も作成できます。

プロンプト例

(古い白黒写真)この写真を、自然な色彩でカラー化し、現代の高画質写真のように修復して

活用事例

広告・マーケティング分野の高速化

広告やマーケティン部分野では、以下のような用途が考えられます。

用途名 概要
商品広告画像の生成 自社商品とモデル画像を合成し、着用イメージを即座に作成
シミュレーション 家具レイアウトや試着イメージなど、様々なシミュレーションのイメージ作成
サムネイル量産 広告バナー、 YouTube やブログのサムネイルを短時間で生成
グローバル展開 日本語ポスターを、レイアウトを維持したまま多言語化

商品広告画像の生成の例を紹介します。

例えば、コスメなどの自社商品画像と、モデルの画像を 2 つ準備します。今回はサンプルとして、Nano Banana Pro を使って架空の商品と人物を作成しています。

参考画像① : 架空の化粧水

参考画像② : 架空のモデル

この2つの画像をアップロードしたうえで、以下のようなプロンプトを送信します。

この女性がこの化粧水を片手に持ちながら、床に座り込んでいる。
グレー背景のクールなイメージで、ブランド「G-gen」宣伝用のポスターを作って。

このままでも広告として利用できますが、少し雰囲気を変えていきます。続けて、以下のようなプロンプトを送信して修正していきます。

この女性が立った状態で壁にもたれかかっている。 また、化粧水が魅力的に見えるポーズを取っている。

この女性が自然の中で太陽を浴びながら、化粧水を額に寄せている

このように自社商品の広告を作成したり、背景や被写体のポーズ、文字の配置も修正できます。光の入り方や影、顔の表情までリアルな写真のように再現できます。

コンテンツ制作

コンテンツ制作の背景では、以下のような用途が考えられます。

用途名 概要
図解の高速化 複雑な情報を視覚的に分かりやすい図解化し、外部公開資料やプレゼン資料の作成を効率化
ストーリーボード制作 被写体の一貫性を保ちつつ、SNS 投稿用の4コマ漫画を内製
キャラクター運用 企業キャラクターを季節イベントや商品紹介などの複数シーンで利用し、企業ブランディングを強化

以下は、インフォグラフィックとしての利用例です。

政府が発表している総合経済対策の PDF 資料は、以下のように複雑な情報がテキストでまとめられており、理解するには隅々まで読む必要があります。

この公開 URL を NotebookLM のソースに追加した後、「インフォグラフィック」をクリックします。

数分後、作成された画像がこちらです。

複雑な情報を AI で要約し、わかりやすくインフォグラフィックで図解してくれます。Nano Banana Pro が使われているため、Nano Banana で発生していた文字化けも少なくなり、日本語対応が進化しています。

注意点としては、現時点(2026年1月現在)の NotebookLM では、インフォグラフィック画像の修正は実装されていません。NotebookLM で生成した画像を編集したい場合は、画像ファイルをダウンロードして Gemini アプリにアップロードしなおし、以下のようなプロンプトを送信します。

この画像を縦型 9:16 にして

続けて、以下のようなプロンプトも送信してみます。

女性がこの画像の内容を、カラーの 4 コマ漫画で説明している

上記のように、一度生成した画像は、Gemini アプリを使うことで会話形式で段階的な修正が可能です。

留意点

法的・倫理的リスク(著作権と利用規約)

著作権・肖像権の侵害

既存のアニメキャラクターや有名人、実在の人物の写真をモデルにして画像を生成・公開する行為は、著作権や肖像権の侵害にあたる可能性があります。

名誉毀損

実在の人物の姿を使って不適切な合成画像を公開した場合、名誉毀損にあたる可能性があり、注意が必要です。

技術的制約・品質管理

商用利用時の推奨モデル

広告利用を含む商業利用を行う場合、Google Workspace with Gemini または Vertex AI の利用が推奨されています。

利用上限

Business Standard 以上の場合、1日あたり最大100〜1,000枚の画像生成が可能です。

Business Standard 以下の場合、1日3枚の画像生成が可能です。詳細は以下のドキュメントを参照してください。

SynthID(電子透かし)の埋め込み

Gemini で生成されたすべての画像には、AI による生成物であることを識別するための目に見えるロゴと、編集を行っても保持される見えない SynthID デジタル透かしが自動的に埋め込まれます。

川村真理(記事一覧)

クラウドソリューション部 クラウドサポート課

美容業界からITへ転身。Google Workspace 専任サポートから Google Cloud にも興味が湧き日々奮闘中。海外旅行が大好きで11カ国突破、これからも更新予定