人工知能関連のプログラム例(Google Colaboratory など)の紹介
人工知能関連のGoogle Colab プログラム例などを紹介する.
Web ページによる説明
チャットボット,翻訳,画像の合成,欠損の補充,イメージ・インペインティング,イメージ・アウトペインティング
- ChatGPT,AskYourPDF プラグインを用いて PDF ファイルの下調べ
- ドキュメント・チャットにファイルをアップロードし,質問応答システムをオンライン実行(チャットボットによる質問応答システム)
- DocsBot にファイルをアップロードし,質問応答システムをオンライン実行(チャットボットによる質問応答システム)
- DeepL API 認証キーの取得と動作確認(人工知能による翻訳)
- ビデオを他人の顔に入れ替える(Simple DeepFace を使用,Google Colab 上での実行)
人物写真、人物動画からの人物動画の合成
- オンラインサービス Waifu Labs を使ってみる
アニメ絵キャラクタ顔の生成
- DALL E をオンラインで使ってみる
画像生成,画像の欠損の補充,イメージ・インペインティング,イメージ・アウトペインティング
- 画像のセグメンテーション(TensorFlow のチュートリアルのサイト)
情報サイト(外部ページのリンク)
- Papers With Code
- Hugging Face
- HuggingFace Datasets library
https://colab.research.google.com/github/huggingface/datasets/blob/main/notebooks/Overview.ipynb
- GitHub の HuggingFace の Transformer
- OSF | Theory of Mind May Have Spontaneously Emerged in Large Language Models
コジンスキー氏らによる Theory of Mind の例題(プログラムのソースコードなど)
セグメンテーション

ポイント・トラッキング(Point tracking)
- CoTracker のデモ(Google Colaboratory)
MOT
- Yolo tracking デモ(MOT)(Google Colaboratory のページ)
公式の Google Colaboratory 上のデモページ: https://colab.research.google.com/drive/18nIqkBr68TkK8dHdarxTco6svHUJGggY?usp=sharing#scrollTo=RyXr0xsZB897
- Cutie のビデオオブジェクトセグメンテーションのデモ(Google Colaboratory のページ)
公式の Google Colaboratory 上のデモページ: https://colab.research.google.com/drive/1yo43XTbjxuWA7XgCUO9qxAi7wBI6HzvP?usp=sharing#scrollTo=qYv3kbaQT2w4
URL: https://hkchengrex.github.io/Cutie
姿勢推定
- LART デモ(姿勢推定)(Google Colaboratory のページ)
https://www.pexels.com/video/group-of-boys-plays-soccer-in-a-soccer-field-2932301/ で公開されている動画を使用したときの結果
ゼロショットの物体検出,セグメンテーション
- Grounding DINO (ゼロショットの物体検出)のオンラインデモ(Google Colaboratory 上): https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/zero-shot-object-detection-with-grounding-dino.ipynb
- HQ-SAM (ゼロショットのセグメンテーション)のオンラインデモ(Google Colaboratory 上): https://colab.research.google.com/drive/1QwAbn5hsdqKOD5niuBzuqQX4eLCbNKFL?usp=sharing
直線検知
- ELSED による直線検知(オンラインデモ)
https://colab.research.google.com/github/iago-suarez/ELSED/blob/main/Python_ELSED.ipynb
イメージ・マッチング
- GlueStick 法によるイメージ・マッチング(オンラインデモ)
https://colab.research.google.com/github/cvg/GlueStick/blob/main/gluestick_matching_demo.ipynb
画像生成,イラスト生成
- プロンプトからの画像生成, OpenJourney のオンラインデモ
https://replicate.com/prompthero/openjourney
3次元モデルの生成
- Text-to-3D の公式のオンラインデモ(Google Colaboratory): https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb
Google Colaboratory なので,英語の「プロンプト」を各自で修正して実行可能. そして,処理結果(3次元データ)は,簡単な操作でダウンロードできる.
プログラム
処理結果(3次元データ)を Blender で表示したスクリーンショット:
処理結果(3次元データ): icecream_mesh.obj, icecream_mesh.mtl, icecream_mesh_albedo.png, icecream_model.ply
処理結果のスクリーンショット(動画): icecream.mp4
- DreamGaussian の Image-to-3D の公式のオンラインデモ(Google Colaboratory): https://colab.research.google.com/drive/1sLpYmmLS209-e5eHgcuqdryFRRO6ZhFS?usp=sharing
写真1枚から,テクスチャ付きの立体データを生成
元画像
中間結果(左),最終結果のスクリーンショット(右)
処理結果(3次元データ): b.obj, b.mtl, b_albedo.png
処理結果のスクリーンショット(動画):
使い方のヒント
- Google Colaboratory を使用している
- 前準備として画像ファイルを準備.ファイル名は英語が良い(a.jpg, b.png)のように
- 上のページで「ランタイム」,「すべてのセルを実行」で実行開始.途中で,画像ファイルを1つアップロード.
- 無料版のGoogle Colaboratoryを使っている場合などは,GPU のメモリ不足でエラーが出る場合がある.エラーが出た場合,「ランタイム」,「すべてのセルを実行」で実行を1,2回程度繰り返すと,うまく行く場合が多い.実行のたびに,GPU のメモリの量が変わり,GPUのメモリが多く割り当てられる場合があるため.
- TinyNERF (3次元モデルの生成)
Google Colaboratory のページ
https://colab.research.google.com/github/bmild/nerf/blob/master/tiny_nerf.ipynb
- instant-ngp (3次元モデルの生成)
Google Colaboratory のページ
https://github.com/NVlabs/instant-ngp/blob/master/notebooks/instant_ngp.ipynb
- Text-to-3D の公式のオンラインデモ(Google Colaboratory): https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb