人工知能関連のプログラム例(Google Colaboratory など)の紹介
人工知能関連のGoogle Colab プログラム例などを紹介する.
Web ページによる説明
チャットボット,翻訳,画像の合成,欠損の補充,イメージ・インペインティング,イメージ・アウトペインティング
-  ChatGPT,AskYourPDF プラグインを用いて PDF ファイルの下調べ
 -  ドキュメント・チャットにファイルをアップロードし,質問応答システムをオンライン実行(チャットボットによる質問応答システム)
 - DocsBot にファイルをアップロードし,質問応答システムをオンライン実行(チャットボットによる質問応答システム)
 - DeepL API 認証キーの取得と動作確認(人工知能による翻訳)
 -  ビデオを他人の顔に入れ替える(Simple DeepFace を使用,Google Colab 上での実行)
人物写真、人物動画からの人物動画の合成
 -  オンラインサービス Waifu Labs を使ってみる
アニメ絵キャラクタ顔の生成
 -  DALL E をオンラインで使ってみる
画像生成,画像の欠損の補充,イメージ・インペインティング,イメージ・アウトペインティング
 - 画像のセグメンテーション(TensorFlow のチュートリアルのサイト)
 
情報サイト(外部ページのリンク)
- Papers With Code
 - Hugging Face
 -  HuggingFace Datasets library
https://colab.research.google.com/github/huggingface/datasets/blob/main/notebooks/Overview.ipynb
 - GitHub の HuggingFace の Transformer
 -  OSF | Theory of Mind May Have Spontaneously Emerged in Large Language Models
コジンスキー氏らによる Theory of Mind の例題(プログラムのソースコードなど)
 
セグメンテーション
ポイント・トラッキング(Point tracking)
-  CoTracker のデモ(Google Colaboratory)
 
MOT
-  Yolo tracking デモ(MOT)(Google Colaboratory のページ)
公式の Google Colaboratory 上のデモページ: https://colab.research.google.com/drive/18nIqkBr68TkK8dHdarxTco6svHUJGggY?usp=sharing#scrollTo=RyXr0xsZB897
 -  Cutie のビデオオブジェクトセグメンテーションのデモ(Google Colaboratory のページ)
公式の Google Colaboratory 上のデモページ: https://colab.research.google.com/drive/1yo43XTbjxuWA7XgCUO9qxAi7wBI6HzvP?usp=sharing#scrollTo=qYv3kbaQT2w4
URL: https://hkchengrex.github.io/Cutie
 
姿勢推定
-  LART デモ(姿勢推定)(Google Colaboratory のページ)
https://www.pexels.com/video/group-of-boys-plays-soccer-in-a-soccer-field-2932301/ で公開されている動画を使用したときの結果
 
ゼロショットの物体検出,セグメンテーション
-  Grounding DINO  (ゼロショットの物体検出)のオンラインデモ(Google Colaboratory 上): https://colab.research.google.com/github/roboflow-ai/notebooks/blob/main/notebooks/zero-shot-object-detection-with-grounding-dino.ipynb
 -  HQ-SAM (ゼロショットのセグメンテーション)のオンラインデモ(Google Colaboratory 上): https://colab.research.google.com/drive/1QwAbn5hsdqKOD5niuBzuqQX4eLCbNKFL?usp=sharing
 
直線検知
-  ELSED による直線検知(オンラインデモ)
https://colab.research.google.com/github/iago-suarez/ELSED/blob/main/Python_ELSED.ipynb
 
イメージ・マッチング
-  GlueStick 法によるイメージ・マッチング(オンラインデモ)
https://colab.research.google.com/github/cvg/GlueStick/blob/main/gluestick_matching_demo.ipynb
 
画像生成,イラスト生成
- プロンプトからの画像生成, OpenJourney のオンラインデモ
 
3次元モデルの生成
-  Text-to-3D の公式のオンラインデモ(Google Colaboratory): https://colab.research.google.com/github/camenduru/dreamgaussian-colab/blob/main/dreamgaussian_colab.ipynb
Google Colaboratory なので,英語の「プロンプト」を各自で修正して実行可能. そして,処理結果(3次元データ)は,簡単な操作でダウンロードできる.
プログラム
処理結果(3次元データ)を Blender で表示したスクリーンショット:
処理結果(3次元データ): icecream_mesh.obj, icecream_mesh.mtl, icecream_mesh_albedo.png, icecream_model.ply
処理結果のスクリーンショット(動画): icecream.mp4
 -  DreamGaussian の Image-to-3D の公式のオンラインデモ(Google Colaboratory): https://colab.research.google.com/drive/1sLpYmmLS209-e5eHgcuqdryFRRO6ZhFS?usp=sharing
写真1枚から,テクスチャ付きの立体データを生成
元画像
中間結果(左),最終結果のスクリーンショット(右)
処理結果(3次元データ): b.obj, b.mtl, b_albedo.png
処理結果のスクリーンショット(動画):
使い方のヒント
- Google Colaboratory を使用している
 - 前準備として画像ファイルを準備.ファイル名は英語が良い(a.jpg, b.png)のように
 - 上のページで「ランタイム」,「すべてのセルを実行」で実行開始.途中で,画像ファイルを1つアップロード.
 - 無料版のGoogle Colaboratoryを使っている場合などは,GPU のメモリ不足でエラーが出る場合がある.エラーが出た場合,「ランタイム」,「すべてのセルを実行」で実行を1,2回程度繰り返すと,うまく行く場合が多い.実行のたびに,GPU のメモリの量が変わり,GPUのメモリが多く割り当てられる場合があるため.
 
 -  TinyNERF (3次元モデルの生成)
Google Colaboratory のページ
https://colab.research.google.com/github/bmild/nerf/blob/master/tiny_nerf.ipynb
 -  instant-ngp (3次元モデルの生成)
Google Colaboratory のページ
https://github.com/NVlabs/instant-ngp/blob/master/notebooks/instant_ngp.ipynb