Windows で動く人工知能関係 Pythonアプリケーション，オープンソースソフトウエア）

人工知能，コンピュータビジョン，音声処理，自然言語処理関係を記載．

各々のソフトウェアの利用条件などは、利用者で確認すること．

【サイト内の関連ページ】

Windows でのインストール

人工知能関連（人工知能，コンピュタービジョン，音声処理，自然言語処理）のインストール: 別ページ »にまとめ
３次元関連のインストール: 別ページ »にまとめ
その他（プログラミング，データベース，各種ライブラリやツールなど）のインストール: 別ページ »にまとめ
GPU環境でのTensorFlow 2.10.1のインストールと活用（Windows 上）: 別ページ »で説明
Windows での NVIDIA ドライバ，NVIDIA CUDA ツールキット 11.8，NVIDIA cuDNN v8.9.7 のインストールと動作確認: 別ページ »で説明
Windows での主要なソフトウェアのインストールと設定: 別ページ »で説明

各種オンラインサービス

オンラインサービス（人工知能関連）: 別ページ »にまとめ
オンラインサービス（プログラミング関連）: 別ページ »にまとめ
その他，種々のオンラインサービス: 別ページ »にまとめている．

Windows の使い方

Windows のまとめ: 別ページ »で説明

単純な分類（Python プログラム）

数層の単純なニューラルネットワーク（全結合，畳み込みニューラルネットワーク）を使用

ニューラルネットワークの作成，学習，検証（Python プログラム）

TensorFlow データセットのパイプライン（Python プログラム）

TensorFlow のパイプラインを用いたMNIST データセットによる学習と分類（TensorFlow データセット，TensorFlow，Python を使用）（Windows 上，Google Colaboratroy の両方を記載）

1. 画像認識

画像分類 (image classification)

画像分類（MMPretrain のインストールと動作確認）（PyTorch，Python を使用）（Windows 上）

物体検出，画像のセグメンテーション (object detection, image segmentation)

トラッキング・ビジョン

インタラクティブ・ビデオオブジェクトセグメンテーション

MiVOS のインストールと動作（Windows 上）

画像の増量

画像の増量を行う Python プログラム（Python，opencv-python を使用）（Windows 上）

Zero Shot や Few Shot による物体検出やセグメンテーション，SAM

教師なし学習によるセグメンテーション

教師なし学習による物体検出とインスタンスセグメンテーション（CutLER，VideoCutLER，Detectron2, PyTorch, Python を使用）（Windows 上）

顕著オブジェクト (salient object)

BASNet のインストールとテスト実行（顕著オブジェクトの検出）（Python，PyTorch を使用）（Windows 上）

2. Stable Diffusion，画像生成，スタイル変換，超解像，ノイズ除去，インペインティング，マッティング

Stable Diffusion

画像生成，超解像，アップコンバート，画像のノイズ除去，イメージ・インペインティング，イメージ・マッティング

upscayl へのリンク（アップコンバートのツール）
https://github.com/upscayl/upscayl

Text-Image モデル

OpenCLIP のインストールと動作確認（Image-Text）（Python，PyTorch を使用）（Windows 上）

教師なし学習による画像復元

教師データ無しでの画像復元 (DmitryUlyanov/deep-image-prior，Python，CUDA 9.2，pytorch, torchvision を使用)

プロンプトや画像からの立体生成

Shap-E のインストールと動作確認（テキストや画像からの立体生成）（Python，PyTorch を使用）（Windows 上）

発声動画の生成

音声と画像ファイルから発声動画を生成するなど

発声動画の生成（SadTalker，Python，PyTorch を使用）（Windows 上）

顔の生成

3. 対話型AI，チャットボット，大規模言語モデル (large language model)

日本語言語モデル

言語モデル

OpenAI API，チャットボットのプログラム

関連技術

ChatGPT の回答のファクトチェック（factool，Python を使用）（Windows 上）
ChatGPT の回答の中の「徳川家康は日本のほとんどを統制下に置いた」が「徳川家康は日本の一部を統制下に置いた」に修正されている．

4. 自然言語処理，文字認識

日本語処理

Bag of Words，TF/IDF，Latent Semantic Indexing，Latent Dirichlet Allocation，類似検索

テキスト検出

文字認識，ナンバープレート認識

EasyOCR のインストールと動作確認（多言語の文字認識）（Python，PyTorch を使用）（Windows 上）
Windows環境におけるTesseract OCR 5.3.3のインストールと日本語OCR実行手順
OpenALPR 2.3.0 のインストールと動作確認（ナンバープレート認識）（Windows 上）
* OpenALPR は，欧米などの乗用車のナンバープレート認識ソフトウェア．

5. 音声

音声認識，文字起こし

音声合成

音声処理

音源分離（audio source separation）

asteroid のインストールと動作確認（音源分離）（Python，PyTorch を使用）（Windows 上）

音声のノイズ除去

APO Ewualizer Download のページ: https://equalizerapo.com/download.html

音楽生成

MusicGen のインストールと動作確認（作曲）（Python，PyTorch を使用）（Windows 上）

ピッチ推定（pitch estimation）

CREPE のインストール，CREPE を用いた音声分析プログラム（音のピッチ推定）（Python，TensorFlow を使用）（Windows 上）

6. コンピュータビジョン

画像の基本機能

ビデオ処理，ビデオの安定化

ビデオの安定化は，ビデオの揺れ（手ぶれ，カメラ搭載機器の揺れなどの緩和）を行う．

VidGear のインストールと動作確認（ビデオの安定化，その他ビデオ処理のライブラリ）（Python を使用）（Windows 上）

線分検知

ELSED のインストールと動作確認（線分検知）（Build Tools, Python を使用）（Windows 上）

消失点推定

neurvps のインストールと動作確認（消失点推定）（Python，PyTorch を使用）（Windows 上）

セグメンテーション

SLIC (scikit-image に含まれる）のインストールと動作確認（スーパーピクセル）（Python を使用）（Windows 上）

画像補正

chasank/Image-Rectification のインストールと画像補正の実行（画像補正）（Python を使用）（Windows 上）
画像補正は，画像を射影変換することにより，斜め方向からの撮影画像を正面画像に変換する．意図しないカメラ回転（ロール、ピッチ、ヨー）を含む画像を正面画像に補正できる．

位置合わせ

vishwa91/pyimreg のインストールと動作確認（画像の位置合わせ）（Windows 上）

Python 用 opencv-python のインストール（Windows 上）: 別ページ »で説明

ステレオマッチング

ArtyZiff35/3D_Reconstruction_From_Stereo_Images のインストールとステレオ画像からの３次元モデルの生成（ステレオ画像，深度マップ，色付き３次元点群）（Python を使用）（Windows 上）

7. トラッキング・ビジョン

MMTracking のインストールと動作確認（トラッキングビジョン）（PyTorch，Python，MMCV，MMDetection を使用）（Windows 上）

8. ビジュアルオドメトリ

uoip/monoVO-python のインストールと動作確認（ビジュアルオドメトリ）（Windows 上）

9. 姿勢推定 (Pose Estimation)

人体の姿勢推定，モーションキャプチャ

頭部の姿勢推定

まばたき，眼球運動

berenslab/uneye のインストールと動作確認（まばたき，眼球運動の検出）（PyTorch, Python を使用）（Windows 上）

瞳孔の検出

TobiasRoeddiger/PupilTracker のインストールと動作確認（瞳孔の検出）（Dlib，Python を使用）（Windows 上）

10. ３次元再構成

11. 顔情報処理（顔検出，顔認識，表情推定，年齢推定，顔のランドマーク，マスク有り顔，肌色領域）

顔情報処理

マスク有り顔

chandrikadeb7 / Face-Mask-Detection のインストールと動作確認（マスク有り顔，マスクなし顔の検出）（Python，TensorFlow を使用）（Windows 上）

肌色領域

mpatacchiola/DeepGaze のインストールと動作確認（肌色領域の抜き出し，saliency の検出）（TensorFlow 1.15.5，Python 3.7 を使用）（Windows 上）
https://github.com/mpatacchiola/deepgaze で公開されているプログラムを利用
肌色領域検出プログラム skindetect.py プログラムの紹介
https://gist.github.com/parosky/7890436 で公開されている肌色領域検出プログラムを紹介

12. 予測

PyTorch Geometric Temporal のインストールと動作確認（予測）（Python，PyTorch を使用）（Windows 上）

13. データセット

14. 人工知能開発環境，ツール