Nano Banana Pro 活用ガイド

Googleの画像生成AIモデル「Nano Banana Pro」の基本操作、コア機能、効果的な活用法と回避すべき落とし穴

学習内容の構成

  1. 基本操作:Geminiアプリでの思考モード選択とプロンプト入力
  2. コア機能:思考モードによる意図の解釈、マルチリファレンスによる最大14枚の参照画像処理
  3. 活用法:論理的図解の生成、キャラクター一貫性の保持、対話による段階的編集、Google検索連携
  4. 落とし穴の回避:モード混同、過剰なプロンプト、否定指示の誤用への対策

目次

スライド資料: [PDF], [パワーポイント]

YouTube動画:https://youtu.be/b2VamyZnMcY

1. はじめに

1.1 Nano Banana Proとは

Nano Banana Proは、Googleが提供する画像生成・編集AIモデルである。従来の画像生成AIが苦手としていた「論理的な構成」「正確なテキスト描画」「複数画像の統合」といった課題に対応している。

1.2 Nano BananaとNano Banana Proの違い

Geminiの画像生成には2つのモデルがある。用途に応じて使い分ける。

項目 Nano Banana(高速モード) Nano Banana Pro(思考モード)
参照画像数 限定的 最大14枚
処理速度 高速 やや遅い
推奨用途 ラフ案、試行錯誤 本番制作、複雑な編集
無料版上限 1日100枚 1日3枚

2. 基本操作

2.1 操作手順

  1. Geminiアプリ(https://gemini.google.com/app?hl=ja)にアクセスし、Googleアカウントでログインする
  2. 画面下部の「画像を作成」をクリックする
  3. 画面右下のプルダウンから「思考モード」を選択する
  4. テキスト入力欄に生成したい画像の説明を入力し、送信する

2.2 プロンプト例

森の中で本を読んでいる柴犬のイラスト。暖かい午後の光が差し込んでいる。
「営業部」と書かれた木製のドアプレート。シンプルで清潔感のあるデザイン。
添付の画像の人物が爆笑している。背景はハワイの海岸

3. コア機能

3.1 思考モード

ユーザーの指示の「意図」や「文脈」を整理してから画像を生成するとされている。これにより、複雑な指示でも意図に近い結果が得られやすい。

3.2 マルチリファレンス

最大14枚の参照画像を同時に処理できる。これにより、複数の要素を組み合わせた画像を生成したり、特定の人物やオブジェクトの特徴を維持したりできる。内訳は以下のとおり。

4. 活用法

4.1 論理的図解の生成

情報の階層構造や正確なテキストを描画できる。

適用例:システム構成図、組織図、フローチャート

プロンプト例

左から右へのフローで、3つのボックスを配置。
ボックス1:「入力層」、ボックス2:「処理層」、ボックス3:「出力層」
各ボックスは矢印で接続。背景は白、文字は黒。

4.2 キャラクター一貫性の保持

参照画像を読み込むと、同一キャラクターを異なるシーンで描写できる。

適用例:絵コンテ作成、広告バナーの量産

プロンプト例

この人物が、カフェでノートPCを開いて作業している様子

4.3 対話による段階的編集

生成した画像を対話形式で修正できる。

4.4 Google検索連携

Google検索と連携し、最新の情報を画像に反映できる。

適用例:天気予報の視覚化、最新ニュースに基づく図解

プロンプト例

東京の今後5日間の天気予報をチャート形式で視覚化

5. 回避すべき落とし穴

5.1 モード混同

問題:高速モードで複雑な指示を実行すると、文字化けや構成崩れが発生しやすいといわれている。

対策:本番制作では、「思考モード」を選択する。

5.2 過剰なプロンプト

問題:「4k, masterpiece, trending on artstation」等の呪文的キーワード(旧世代の画像生成AIで効果があるとされた定型句)は逆効果となることがある。

対策:自然な文章で記述する。

悪い例:

beautiful girl, 4k, masterpiece, best quality

良い例:

窓際に座っている若い女性。柔らかい自然光が顔を照らしている。

※本項目は、画像生成AIの利用者間で一般的に知られている情報に基づく。

5.3 否定指示の誤用

問題:「~を描かないで」は、逆にその対象を意識した画像が生成されることがある。

対策:肯定的な表現で記述する。

悪い例:

車を描かないで

良い例:

人物だけが存在するシーン。背景は白の無地。

※本項目は、画像生成AIの利用者間で一般的に知られている情報に基づく。

6. 演習課題

課題1:思考モードで以下のプロンプトを実行し、テキストが正確に描画されるか確認せよ。

「会議中」と書かれたドアプレート

課題2:3階層のシステム構成図(入力層→処理層→出力層)を生成せよ。