スライド 1: 2. 人工知能の仕組み,責任ある活用
スライド 2: 今日の内容
スライド 3: 2-1 振り返り
スライド 4: 情報工学の三大要素「対象・構造・条件」
スライド 5: 第1回と第2回の内容を,「対象・構造・条件」で整理
スライド 6: 第1回プログラミング基礎とAIの連続性
スライド 7: 第1回プログラミング基礎とAIの連続性
スライド 8: 2-2 AI の基礎
スライド 9: AIの基礎
スライド 10: AIの利点
スライド 11: AIの欠点
スライド 12: 2-3 AI の種類
スライド 13: 人工知能の種類
スライド 14: 機械学習の特徴
スライド 15: 訓練データと学習の仕組み
スライド 16: 機械学習の定義
スライド 17: ニューラルネットワークの基本構造
スライド 18: 知的な IT システム
スライド 19
スライド 20: 2-4 AI でできること(応用分野)
スライド 21: 人工知能の応用例
スライド 22: 人間の言葉、声の処理:対話型AI(チャットボット)
スライド 23: 人間の言葉、声の処理:自動翻訳サービス
スライド 24: 視覚情報処理:画像分類
スライド 25: 視覚情報処理: オブジェクトの発見・検知
スライド 26: 視覚情報処理:顔検知
スライド 27: 視覚情報処理:顔識別(顔からの人物特定)
スライド 28: 視覚情報処理:目の動きの読み取り
スライド 29: 視覚情報処理:表情の自動判定
スライド 30: 視覚情報処理:人体の姿勢の読み取り
スライド 31
スライド 32
スライド 33: 視覚情報処理:群衆の数のカウント
スライド 34: データ分析と予測
スライド 35: 自動化,最適化
スライド 36: 知識表現
スライド 37: 2-5 AI による合成
スライド 38: GAN(敵対的生成ネットワーク)
スライド 39: GAN の仕組み
スライド 40: GANの応用例
スライド 41: ANと現在のテキスト画像合成の関係
スライド 42: テキストからの画像合成
スライド 43: フェイクビデオ
スライド 44
スライド 45: 2-6 AIの現状と注意点
スライド 46: ① AI の利用での注意点
スライド 47: ② AI を責任をもって利用するために
スライド 48: 人工知能についての考え方
スライド 49: 演習
スライド 50: 演習の前に: 「学習率」とは
スライド 51: 1. ニューラルネットワークの学習過程の可視化
スライド 52: 2. 探索アルゴリズムによる経路探索の可視化
スライド 53: 3.畳み込みニューラルネットワークの内部構造の可視化
スライド 54: 4. 人間の下書きを人工知能が清書する
2.
人工知能の仕組み,責任ある活用
(コンピューターサイエンス)
1
金子邦彦
謝辞:この資料では「いらすとや」のイラストを使用している
今日の内容
•
情報工学の基本的な枠組み「
対象・構造・条件
」、
プログラミング基礎(条件分岐・繰り返し)
と
AI
技術の関連
•
機械学習と知的
IT
システムの違い
を理解,
AI
の幅
広い応用
を確認
•
テキストからの画像合成
,その基礎となる
GAN
の
仕組を理解
•
AI
の誤りやデータの偏り
を認識し,
責任ある活用
判断力を養う
•
演習では
T
ensorFlow
Playground
等で
AI
の学習・探
索過程を確認,動作原理を体得
2
2-
1
振り返り
3
情報工学の三大要素「対象・構造・条
件」
情報工学の基本は「対象・構造
・条件」の
3
つで整理
で
きる.
•
対象
:扱うデータや対象物
•
構造
:問題が展開される空間や枠組み
•
条件
:解を求める基準や制約
日常の例:「
近くのコンビニを探す
」
•
対象
:コンビニ店舗リスト
•
構造
:道路や歩道のネットワーク
•
条件
:歩道で一番近い(直線距離)
対象・構造・条件のどれかが変
われば,答えも変わ
る.
4
第
1
回と第
2
回の内容を,
「対象・構造・条件
」で
整理
第
1
回(
Scratch
)
•
対象
:スプライト(キャラクター)
•
構造
:ステージ(座標空間)
•
条件
:「もし端に着いたら跳ね返る」
「
10
歩動かす
を
5
回繰り返す」
第
2
回(
AI
)
•
対象
:画像データ,テキスト,数値デ
ータセット
•
構造
:ニューラルネットワークの層と
接続,グリッ
ド
上の通路と壁
•
条件
:「正しく分類する」「最短経路
で到達する」
5
第
1
回プログラミング基礎と
AI
の連続性
第
1
回で学んだプログラミングの基礎は,
AI
とも関係がある
条件分岐「もし〜
なら
〜,でなければ〜」
知的な
IT
システムの根幹をなす.「もし体温が
38
度以上なら
発熱の可能性」,
「もし特定のキーワードを含むなら迷惑
メール」のように,専門家の知識を条件分岐のルールとして
記述
繰り返し
機械学習と探索の両方の基盤である.
•
機械学習:訓練データによる学習を何百・何千回と繰り返
す(
Epoch
).繰り返すたびに精度が向上
•
探索:隣接するセルを繰り返し調べ,最短経路を発見.
6
第
1
回プログラミング基礎と
AI
の連続性
Scratch
では,
入力(キーボ
ードやマウス
)
→
処理(条
件分岐と繰り返し)
→
出力(スプライトの動き)
とい
う流れがあった.
AI
も同じ流れで動く.
•
ニューラルネットワーク:画像
→
各層での処理
→
分
類結果
•
探索:スタート地点
→
アルゴリズムによる探索
→
最
短経路
•
AutoDraw
:手描き
→
AI
による認識
→
清書の候補
この「入力
→
処理
→
出力」の流れは,
プログラミン
グで
も
AI
でも共通する情報工学の基本で
ある.
7
2-2
AI
の基礎
8
AI
の基礎
AI
の定義
•
人工知能(
AI
)は,コンピュータが
人間のような知的能力を
持つ
ことを目指す技術.
AI
の
3
要素
①
知能
:思考や判断などの能力
②
知識
:情報を収集し,処理する能力
③
学習
:知的な能力が向上する能力
9
AI
の利点
•
24
時間
365
日
稼働可能
•
大量データ
の高速処理が可能
•
人間が見落としがちな
細かいパターンを検出
できる
•
反復作業
を効率化できる
10
AI
の欠点
•
創造性
や
柔軟性
に限界がある
•
予期せぬ状況への対応
が苦手
•
倫理的判断
が必要な場面では人間の介在が必要
•
学習時
に用いられた
データの品質や偏り
によって,結果の
精度が低下する場合がある
11
2-3
AI
の種類
12
人工知能の種類
13
知的な
IT
システム
人間が書いたルールや知識
を用いて,
意思決定や問題
解決
を行う人工知能.
人間が直接プログラムする
ため,
説明可能性は高い
.
機械学習
コンピュータが
データを用いて自ら学習
し,
知的能力
を向上
させる技術.データを与えて学習させることで,
より正確に予測や分析や合成ができる
ようになる.柔
軟性が高い.
人工知能は大きく
2
種類に分けられる.
14
•
情報の抽出
:データの中からパ
ターンや関係性を自動で見つけ出
す能力
•
簡潔さ
:人間が設定しなければな
らなかったルールを、自動で生成
できるようになる
•
限界の超越
:他の方法では難し
かった課題でも、機械学習を用い
ることで解決策や視点を得られる
可能性がある
機械学習の特徴
応用事例
画像理解,自然言語処理,予測な
ど多数の分野で活用されている
訓練データと学習の仕組み
15
機械学習のプログラムが訓練
データを用いて学習を行う
プログラム
学習の結果,文字認識の能力を獲得する.
学習ののち,新たな手書き数字の画像分類
を行うことができる.
大量の訓練データを用いて
学習を行う
例:手書き数字の
画像
60000
枚
それぞれの正解
(
4, 1, 0, 7, 8, ...
)
60000
個
⇒
訓練データとして使用する.
機械学習の定義
訓練データ
16
学習
知的能力が向上
3種類に分類済み
3種類への分類能力を習得
■
訓練データを用いて学習し,その結果として知的
能力が向上する
■訓練データの追加により,さらに知的能力が向上
する可能性がある
ニューラルネットワークの基本
構造
https://playground.
tensorflow
.org
17
機械学習
の代表的な手法のひとつに
ニューラルネットワーク
がある.あとでデータを与えて学習させる仕組み.
T
ensorFlow Pla
y
gr
ound
ニューラルネットワークの構造可視化
・
D
A
T
A
(データセットの選択)
・
FE
A
TURES
(入力特徴量)
・
HIDDEN LA
YERS
(隠れ層の数とニューロ
ン数)
・
OUTPUT
(分類結果)
学習パラメータ
・
Learning r
at
e
(学習率)
・
Activ
ation
(活性化関数)
・
Epoch
(学習回数)
分類の様子を観察できる.
知的な
IT
システム
人間が書いたルールや知識
を用いて,
意思決定
や
問
題解決
を行う人工知能.
18
■
探索による問題解決
:
例:
6
つの小部屋があり,上下左右
に動くことができるというルール
を
プログラム化
する.
3
回動くとどこにたどり着くかを,
コンピュータが全ての組み合わせを
探索
して結果を出力する
■
エキスパートシステム
:
専門家の知識を
ルール
(「
もし〜な
らば
〜
」の形式)として記述し
,コ
ンピュータに判断させる仕組み.
■
ルールベースのフィルタリング
:
あらかじめ定めた条件に基づいて,
データを自動的に分類する
仕組み.
例:
メールの件名や本文に特定の
キーワード
が含まれる場合に
迷惑
メール
として分類するシステム
機械学習
知的な
IT
システム
知識の由来
データから自動で獲得
人間が明示的に記述
具体例
手書き数字認識,画像
生成
エキスパートシステム,
スパムフィルタ
強み
人間が言語化しにくい
パターンにも対応
判断根拠を人間が説明
しやすい
弱み
なぜその結果になった
か説明しにくい場合が
ある
ルールの追加・修正に
人手がかかる
19
両者は相反するものではない。実際のシステムでは両者
を
組み合わせて使われることもある.
2-4
AI
でできること(応用分野)
20
人工知能の応用例
21
顔検知、顔識別
合成
画像のセグメンテーション
W
eb
ブラウザで翻訳を行う
Mat
e T
ransla
te (W
eb
ブラウザ
Fir
ef
o
x
のアドオン
)
人工知能は私たちの生活や仕事を大きく変革する技術.
人間の言葉、声の処理:対話型
AI
(チャ
ット
ボット)
•
文章の翻訳
,
要約,推敲
のほか,
相談や自由なアイデア出
し
に使用できる.
•
ユーザーが質問や依頼を入力すると,
AI
が
回答
や
コード
を生成.
人間の言葉、声の処理:自動翻訳サー
ビス
23
DeepL
の
URL: h
ttp
s://www
.deepl.com/ja/translat
or
W
eb
ブラウザ上でテキストを入力すると,別の言語に自動
翻訳される.
例:
DeepL
,
Mate
T
ranslate
(
W
eb
ブラウザ
Firefox
のアド
オン)
視覚情報処理
:画像分類
元画像
24
画像分類の結果
Google Cloud
Vision
のオンラインサービス
URL
:
h
ttp
s://
cloud.google.com/vision/docs/dr
ag
-and-dr
op
画像を入力すると,
AI
がその内容を認識し,ラベル
(
Forehead 98%, Gla
sses 98%, Chin 97%
等)を付けて分類.
視覚情報処理
:
オブジェクトの発見・検知
25
元画像
人工知能による読み取り結果
(DeepLabv3
+
を使用
)
画像の中のオブジェクト
(人,自転車,車など)を,
AI
が
発見・検知
する.
(例)
DeepLabv3+
を使用した例では,街路の画像から人,
自転車,車,道路,建物等を色分けして検出.
視覚情報処理
:顔検知
26
画像中の
顔の位置
と
大きさの情報
を読み取る技術.
集合写真のような複数人が写る画像からも,各人の顔を矩形
で囲んで検出できる.
視覚情報処理:顔識別(顔からの人物特定)
あらかじめ登録された顔データ
との
距離(類似度)
を
計算
し,
最も距離が近い人物を特定
する技術.
(例)入力画像に対して各人物との距離を算出し,最小距離
の人物名(
younes, distance 0.309...
)を出力する.
27
you
nes
視覚情報処理:目の動きの読み取り
28
瞳孔の位置と動きを追跡
する技術.
目の動きの読み取り(
Pupil T
r
ack
er
を使用)
視覚情報処理:表情の自動判定
29
「驚き
(Surprised)
」と判定
されている
顔画像
から
表情
を自動で判定する技術.
(例)
Angry
, Disgust, Fear
, Happy
, Neutral, Sad, Surprised
の各カテゴリの確率を算出.
Surprised 52.88%
と判定され
た場合,「驚き(
Surprised
)」と判定される.
視覚情報処理:人体の姿勢の読
み取り
30
人体の姿勢を読み取り
(
OpenP
ose
を使用)
人体の関節位置を検出し,骨格を線で結んで姿勢を可視化す
る技術.
(例)スキーや野球などの動きの解析にも応用される.
31
32
視覚情報処理:群衆の数のカウント
33
群衆の数のカウント
(FIDTM
を使用
)
元画像
群衆の画像
から
人数を自動で数える技術
.各人の位置を矩形
で囲んで検出する.
データ分析と予測
過去のデータを基に将来予測を行う技術.
(例)過去の太陽の黒点数から将来の傾向を予測
34
自動化,最適化
作業やプロセス
を人工知能で
自動化
・
最適化
する技
術.
(例)工場の生産工程の最適化,スマートホーム
(家電の自動制御).
35
図は
Gemini
を用いて作成
知識表現
36
Pr
olog
プログラム
human(hanak
o
).
human(t
ar
o).
think(X) :- human(X).
コンピュータが
推論を行い,
その答えを得る
Prolog
プログラムにより
知識
を
ルールとして記述
し,
コン
ピュータが推論
を行い,その
答えを得る
技術.
(例)
human(han
ak
o). human(taro).
think(X) :-
human(X).
と記述し,
human(X).
と問い合わせると,
X
=
hanak
o
, X = taro
という答えが推論により得られる.
2-5
AI
による合成
37
GAN
(敵対的生成ネットワーク)
AI
によるデータの生成能力を示す研究のひとつ.
38
GAN
の仕組み
2
つの
AI
を使って学習を行う
:①人工知能による生
成(生成器)、②人工知能による識別(識別器)
39
生成器と識別器の学習を交互に繰り返す
ことで,生成器
が
本物に近いデータを生成できる
ようになる
ノイズ
生成器
生成され
たデータ
実在の
データ
識別器
実在,
フェイク
生成器が生成したデータと実在
のデータの両方を受け取り,本
物かフェイク(偽物)かを判定
する.本物データを実在,生成
データをフェイクと識別するよ
うに学習する
ノイズを入力として受け取
り,データを生成する.識
別器が誤って判定するよう
なデータを生成するように
学習する
GAN
の応用例
さまざまな種類の画像(犬,風景,蝶,食べ物等
)
を,安定して高精細に生成
40
Large Scale GAN
T
raining for
High Fidelity Natu
ral Image Synthesis
Andrew Brock
,
Jef
f
Donahue
,
Karen Simonyan
, https://arxiv
.org/abs/1809.1
1096v2
AN
と現在のテキスト画像合成の関係
•
GAN
は「
AI
がリアルなデータを生成できる
」
こと
を示した重要な研究である.
•
GAN
は,
生成
AI
という分野を切り拓いた
.
•
その後,
拡散モデル
(
Dif
fusion
Mod
el
)など
新た
な手法が登場
し,現在の
テキスト画像合成
(次
ページ)の基盤になって
いる
41
テキストからの画像合成
42
「
chip
」に対してチップスの画
像を合成
(D
ALL-E
を使用
)
「
f
o
x
」に対してキツネのイラス
トを合成
(D
ALL-E
を使用
)
テキスト(文章)の指示に基づいて,写真やイラストを人工
知能が合成する技術
OpenAI ChatGPT
, Microsoft Co
pilot, Google
Gemini
など
を利用して同様の画像合成が可能
フェイクビデオ
43
+
→
写真
ビデオ
人工知能により
合成されたビデオ
写真とビデオから人工知能により
合成されたビデオを生成
する技術.
(例)ある人の顔の写真と,別の人のビデオを組み合わせ
ると,写真の人がビデオの人の声,表情,語りでそっくり
に語りだす映像が合成される.
44
2-6
AI
の現状と注意点
45
①
AI
の利用での注意点
•
人工知能は、
誤った結果を出すこともある
。
•
人工知能が行うことは限定されており、全てを任せてしま
うのは適切ではない。
•
人工知能は
人間が設定した範囲内でしか活動できない.
そ
れ以外のことについては判断ができない。
•
機械学習で用いる学習データに偏りがあるとき、結果にも
偏りが出てくる。人工知能の判断には注意が必要
。
•
人工知能は、あくまでも「
人間が利用する道具
」であり、
人間次第。人間の判断や考えを補完するために利用される
べき。
46
②
AI
を責任をもって利用するために
•
人間が主導
:
AI
はあくまで人間を支援する道具.
最終的な
判断は人間が行う
•
個人情報の取り扱い
:
AI
は人間が運用している.
AI
が危険
というよりも,
AI
の運営者が危険な場合がある.
AI
に個人
情報を与える際には注意が必要
•
偽情報の抑制
:
AI
の悪用により偽情報の生成が極めて容易
になった.
複数の信頼できる情報源を参照する習慣
が大切
47
人工知能についての考え方
•
高度に発達した人工知能が脅威になるかどうかは自分
で調べ、考察すること
が重要
•
人間がよりクリエイティブになるために人工知能を使
う
ことや、
人と人工知能とロボットが協働すること
が
必然的に起こる可能性がある
48
演習
49
演習の前に:
「
学習率
」とは
学習率は「
1
回の学習でどれだけ大きく修正する
か
」を決める
値
•
学習率が大きすぎる
場合:
修正が大きすぎて
,正
解を飛び越えてしまい,
学習が不安定になる可能
性
•
学習率が小さすぎる
場合:
少しずつしか修正しな
い
ため,学習に多くの
時間がかかる
•
適切な学習率:安定して正解に近づいて
いく
演習1の
T
ensorFlow
Playgr
ound
で学習率を
0.001
,
0.03
,
1
などに変えて,学習の安定性が
どう変化す
るか観察してみよう.
50
1.
ニューラルネットワークの学
習過程の可視化
•
ニューラルネットワークの構造やパラメータを変えながら,
学習の過程を観察できる.
•
T
ensorFlow Playground
を使用.
•
手順:
データセットを選ぶ
→
隠れ層の数やニューロン数
を設定
する
→
再生ボタンで学習
を
開始
→
分類結果の変化
を観察
する.
•
URL:
https://playground
.tensorflow
.org
51
2.
探索アルゴリズムによ
る経路探索の可視化
•
探索アルゴリズムで,
スタート地点からゴール地点までの
経路を見つける過程を可視化
•
手順:
グリッド上に壁を配置
する
→
アルゴリズムを選択
する
→
探索
を開始
→
探索の広がり方と最短経路を観察
す
る.
•
URL:
https://qiao.github.io/PathFinding.js/visual
/
52
3.
畳み込みニューラルネッ
トワークの内部構造
の
可視化
•
畳み込みニューラルネットワーク(
CNN
)の各層
が
入力画
像をどのように処理しているか
を,
3D
で可視化.
•
手順:
描画パッドに数字を描く
→
各層のニューロンの活
性化がリアルタイムに表示
される
→
ニューロンにカーソ
ルを合わせて検出内容を確認
する.
•
URL:
https://adamharley
.com/nn_vis/cnn/3d.html
53
4.
人間の下書きを人工知能
が清書する
54
人工知能が,元の情報を保ったまま人間のイラストを清書す
る技術
AutoDraw
の
URL:
https:/
/www
.autodraw
.com/
人間がイラストを描く
コンピュータが候補を出す
完成