Nano Banana Pro 活用ガイド
学習内容の構成
- 基本操作:Geminiアプリでの思考モード選択とプロンプト入力
- コア機能:思考モードによる意図の解釈、マルチリファレンスによる最大14枚の参照画像処理
- 活用法:論理的図解の生成、キャラクター一貫性の保持、対話による段階的編集、Google検索連携
- 落とし穴の回避:モード混同、過剰なプロンプト、否定指示の誤用への対策
- 前提:Webブラウザの基本操作、Googleアカウント
- 意義:画像生成AIの効果的な活用スキルの習得
目次
YouTube動画:https://youtu.be/b2VamyZnMcY
1. はじめに
1.1 Nano Banana Proとは
Nano Banana Proは、Googleが提供する画像生成・編集AIモデルである。従来の画像生成AIが苦手としていた「論理的な構成」「正確なテキスト描画」「複数画像の統合」といった課題に対応している。
1.2 Nano BananaとNano Banana Proの違い
Geminiの画像生成には2つのモデルがある。用途に応じて使い分ける。
| 項目 | Nano Banana(高速モード) | Nano Banana Pro(思考モード) |
|---|---|---|
| 参照画像数 | 限定的 | 最大14枚 |
| 処理速度 | 高速 | やや遅い |
| 推奨用途 | ラフ案、試行錯誤 | 本番制作、複雑な編集 |
| 無料版上限 | 1日100枚 | 1日3枚 |
2. 基本操作
2.1 操作手順
- Geminiアプリ(https://gemini.google.com/app?hl=ja)にアクセスし、Googleアカウントでログインする
- 画面下部の「画像を作成」をクリックする
- 画面右下のプルダウンから「思考モード」を選択する
- テキスト入力欄に生成したい画像の説明を入力し、送信する
2.2 プロンプト例
森の中で本を読んでいる柴犬のイラスト。暖かい午後の光が差し込んでいる。
「営業部」と書かれた木製のドアプレート。シンプルで清潔感のあるデザイン。
添付の画像の人物が爆笑している。背景はハワイの海岸
3. コア機能
3.1 思考モード
ユーザーの指示の「意図」や「文脈」を整理してから画像を生成するとされている。これにより、複雑な指示でも意図に近い結果が得られやすい。
3.2 マルチリファレンス
最大14枚の参照画像を同時に処理できる。これにより、複数の要素を組み合わせた画像を生成したり、特定の人物やオブジェクトの特徴を維持したりできる。内訳は以下のとおり。
- オブジェクト画像:最大6枚
- 人物画像:最大5名分
4. 活用法
4.1 論理的図解の生成
情報の階層構造や正確なテキストを描画できる。
適用例:システム構成図、組織図、フローチャート
プロンプト例
左から右へのフローで、3つのボックスを配置。
ボックス1:「入力層」、ボックス2:「処理層」、ボックス3:「出力層」
各ボックスは矢印で接続。背景は白、文字は黒。
4.2 キャラクター一貫性の保持
参照画像を読み込むと、同一キャラクターを異なるシーンで描写できる。
適用例:絵コンテ作成、広告バナーの量産
プロンプト例
この人物が、カフェでノートPCを開いて作業している様子
4.3 対話による段階的編集
生成した画像を対話形式で修正できる。
例
- 初回:「青空の下で走っている女性」
- 2回目:「背景を夕焼けに変更」
- 3回目:「服装をビジネスカジュアルに変更」
4.4 Google検索連携
Google検索と連携し、最新の情報を画像に反映できる。
適用例:天気予報の視覚化、最新ニュースに基づく図解
プロンプト例
東京の今後5日間の天気予報をチャート形式で視覚化
5. 回避すべき落とし穴
5.1 モード混同
問題:高速モードで複雑な指示を実行すると、文字化けや構成崩れが発生しやすいといわれている。
対策:本番制作では、「思考モード」を選択する。
5.2 過剰なプロンプト
問題:「4k, masterpiece, trending on artstation」等の呪文的キーワード(旧世代の画像生成AIで効果があるとされた定型句)は逆効果となることがある。
対策:自然な文章で記述する。
悪い例:
beautiful girl, 4k, masterpiece, best quality
良い例:
窓際に座っている若い女性。柔らかい自然光が顔を照らしている。
※本項目は、画像生成AIの利用者間で一般的に知られている情報に基づく。
5.3 否定指示の誤用
問題:「~を描かないで」は、逆にその対象を意識した画像が生成されることがある。
対策:肯定的な表現で記述する。
悪い例:
車を描かないで
良い例:
人物だけが存在するシーン。背景は白の無地。
※本項目は、画像生成AIの利用者間で一般的に知られている情報に基づく。
6. 演習課題
課題1:思考モードで以下のプロンプトを実行し、テキストが正確に描画されるか確認せよ。
「会議中」と書かれたドアプレート
課題2:3階層のシステム構成図(入力層→処理層→出力層)を生成せよ。