金子邦彦研究室人工知能Windows で動く人工知能関係 Pythonアプリケーション,オープンソースソフトウエア)

Windows で動く人工知能関係 Pythonアプリケーション,オープンソースソフトウエア)

人工知能,コンピュータビジョン,音声処理,自然言語処理関係を記載.

各々のソフトウェアの利用条件などは、利用者で確認すること

サイト内の関連ページ

Windows でのインストール
各種オンラインサービス
Windows の使い方

Windows の使い方: 別ページ »で説明

単純な分類(Python プログラム)

数層の単純なニューラルネットワーク(全結合,畳み込みニューラルネットワーク)を使用

ニューラルネットワークの作成,学習,検証(Python プログラム)

TensorFlow データセットのパイプライン(Python プログラム)

1. 画像認識

画像分類 (image classification)
物体検出,画像のセグメンテーション (object detection, image segmentation)
トラッキング・ビジョン
インタラクティブ・ビデオオブジェクトセグメンテーション
画像の増量
Zero Shot や Few Shot による物体検出やセグメンテーション,SAM
教師なし学習によるセグメンテーション
顕著オブジェクト (salient object)

2. Stable Diffusion,画像生成,スタイル変換,超解像,ノイズ除去,インペインティング,マッティング

Stable Diffusion
画像生成,超解像,アップコンバート,画像のノイズ除去,イメージ・インペインティング,イメージ・マッティング
Text-Image モデル
教師なし学習による画像復元
プロンプトや画像からの立体生成
発声動画の生成

音声と画像ファイルから発声動画を生成するなど

顔の生成

3. 対話型AI,チャットボット,大規模言語モデル (large language model)

日本語言語モデル

言語モデル

OpenAI API,チャットボットのプログラム

関連技術

4. 自然言語処理,文字認識

日本語処理
Bag of Words,TF/IDF,Latent Semantic Indexing,Latent Dirichlet Allocation,類似検索
テキスト検出
文字認識,ナンバープレート認識

5. 音声

音声認識,文字起こし
音声合成
音声処理
音源分離(audio source separation)
音声のノイズ除去
音楽生成
ピッチ推定(pitch estimation)

6. コンピュータビジョン

画像の基本機能
ビデオ処理,ビデオの安定化

ビデオの安定化は,ビデオの揺れ(手ぶれ,カメラ搭載機器の揺れなどの緩和)を行う.

線分検知
消失点推定
セグメンテーション
画像補正
位置合わせ

Python 用 opencv-python のインストール(Windows 上): 別ページ »で説明している.

ステレオマッチング

7. トラッキング・ビジョン

8. ビジュアルオドメトリ

9. 姿勢推定 (Pose Estimation)

OpenPose(人体の姿勢推定,モーションキャプチャ)
頭部の姿勢推定
まばたき,眼球運動
瞳孔の検出

10. 3次元再構成

11. 顔情報処理(顔検出,顔認識,表情推定,年齢推定,顔のランドマーク,マスク有り顔,肌色領域)

顔情報処理
マスク有り顔
肌色領域

12. 予測

13. データセット

14. 人工知能開発環境,ツール