人工知能,コンピュータビジョン,音声処理,自然言語処理関係を記載.
各々のソフトウェアの利用条件などは、利用者で確認すること.
【サイト内の関連ページ】
数層の単純なニューラルネットワーク(全結合,畳み込みニューラルネットワーク)を使用
物体検出
インスタンス・セグメンテーション
パノプティック・セグメンテーション
画像生成 (txt2img),画像変換 (img2img)
複数の画像を一度に画像生成
https://github.com/upscayl/upscayl
音声と画像ファイルから発声動画を生成するなど
日本語言語モデル
言語モデル
OpenAI API,チャットボットのプログラム
関連技術
ChatGPT の回答の中の「徳川家康は日本のほとんどを統制下に置いた」が 「徳川家康は日本の一部を統制下に置いた」に修正されている.
ビデオの安定化は,ビデオの揺れ(手ぶれ,カメラ搭載機器の揺れなどの緩和)を行う.
画像補正は,画像を射影変換することにより,斜め方向からの撮影画像を正面画像に変換する. 意図しないカメラ回転(ロール、ピッチ、ヨー)を含む画像を正面画像に補正できる.
Python 用 opencv-python のインストール(Windows 上): 別ページ »で説明
DeepFace, VGG16 + Simase (2手法)による顔識別
https://github.com/mpatacchiola/deepgaze で公開されているプログラムを利用
https://gist.github.com/parosky/7890436 で公開されている 肌色領域検出プログラムを紹介