cs-6. データベースと
データサイエンス
(コンピューターサイエンス)
URL: https://www.kkaneko.jp/cc/cs/index.html
1
金子邦彦
謝辞:この資料では「かわいいフリー素材集 いらすとや」のイラストを使用しています
データベース日常生活に不可欠な基盤技術
であり、生活を豊かで便利にする。
データサイエンスは、データから有益な情報
を引き出し、判断や意思決定を行うための
問分野である。
Excelなどの表計算ソフトは、データサイエ
ンスの実践に役立つ強力なツールである
データベース、データサイエンス、表計算ソ
フトの活用スキルは、将来にわたり役に立つ
2
アウトライン
1. データベースとデータサイエンス
2. 表計算ソフトウエア
3. Office 365 Excel
4. Excel の基本
5. 散布図(Excel を使用)
6. 合計、平均(Excel を使用)
7. 分布、密度(Excel を使用)
3
6-1 データベースと
データサイエンス
4
データベースとは
5
データベースは、特定のテーマや目的に従って収集され
大量のデータ
取引
計測
データ収集
記入
データベース
(データの集まり)
撮影
データ保存
例:銀行、商店、交通機関、電話会社などさまざま
データベースの必要性
6
日常生活での情報管理に不可欠
銀行の銀行口座
ホテルの予約情報
交通機関の座席予約情報
大学の履修登録や出欠の情報
企業の製品情報
電話会社の通話量情報
データベースがなければ、
現代の生活が成り立たない
7
オンラインコミュニケーションでの
データ管理.機能がより便利に.
SNS(ソーシャルネットワーク)
投稿、ユーザプロフィール、「い
いね」、コメントの管理
電子メール
本文、添付ファイル、送信者、受信
者の管理
オンラインのチャット
ユーザ間のメッセージの管理
データベースの利用分野
①オンラインコミュニケーション
8
リアルタイムで安全、便利なサービ
スの提供.
オンラインの取引
注文,支払い,配送状況問い合わせ
オンラインの銀行
送金,残高照会,融資申請
オンラインの予約
列車や飛行機などの座席予約
データベースの利用分野
②オンラインの取引
9
人工知能での学習による上達:デー
タを使用し,学習を通じて知的能力
を向上.
ChatGPT などの対話型AI
(対話,自由なアイデア出し,
要約,翻訳など)
医用画像や自動運転での画像理解
(画像診断、物体認識など)
オンラインショッピングでの情報
推薦
(過去の履歴からの商品の順位付
けなど)
データベースの利用分野
③人工知能
10
正確な予測,効果的な意思決定.
気象予報
気温,風速,風向き,湿度、降水
などの過去データから天候,台風
の進路,気温の変化などを予測
市場調査
販売,顧客からの問い合わせなど
の過去データから,製品の需要な
どを予測
ヘルスケア
データに基づき病気の傾向,副作
用の可能性などを推定
データベースの利用分野
④データによる分析,予測
サイバーフィジカル
物理的な現実世界(フィジカル)と、デジタルな情報世界
(サイバー)が融合したシステム
11
効率化、品質の向上、新サービスの創生を可能に
実世界
サイバー世界
農林畜産業、
医療、
ヘルスケア、
製造業、
都市交通、
電力 など
センサー
データ
サービス
提供
育成法の予測
遠隔医療
故障予測
交通渋滞の予測
需要予測
センサー
センサーの設置
センサーで計
測された距離
画像
人間の通過記録
ここまでのまとめ
データベースは、特定の主題について整理,保存,管理
れたデータの集合体
データベースは、日常生活の情報管理に不可欠
銀行口座、ホテルの予約、大学の登録情報など、さまざまな
情報がデータベース化
データベースにより、我々の生活はより豊かで便利に
オンラインコミュニケーション、リアルタイムのサービス提
供、人工知能の学習と予測の向上、サイバーフィジカルシス
テム(現実世界とデジタル情報世界の融合)による新サービ
スの創出など、多方面に
12
データサイエンス
データサイエンスは、データから有益な情報を抽出する学
問。さまざまな分野で活用されている
ビジネス分野:顧客の嗜好やニーズを分析し、マーケティング戦
略の立案を行う
医療分野:病気の早期発見や効果的な治療法の開発を行う
工学分野:製品品質の改善や予測保全など、生産の最適化を行う
情報化社会において、多くのデータが生み出されている。
データサイエンスは、将来の活躍につながる
データサイエンスは、大量のデータを扱うもの。機械学習
など人工知能情報処理とも大きく関連する。さまざまな
分野でデータを活用する実力につながる。
13
6-2 表計算ソフトウエア
14
パソコンの威力
ワープロ
文書の編集、清書.目次、表の作成など
表計算
データの管理、計算、グラフ作成など
プレゼン
ビジュアル資料作成
インターネット
情報収集、コミュニケーション
15
データはすべてデジタル(ファイル).
管理、共有、交換が簡単
データの記録、保管、共有
表計算の機能 集計・集約、グラフ作成など
表計算ソフトウエアは何の役に立つの
例えば、こんなことが簡単にできます
Excel の画面
Excel の画面
単価を書き変えると
合計が自動
再計算される
表の作成
例えば、こんなことが簡単にできます
グラフ
例えば、こんなことが簡単にできます
条件に合致するデータの
強調表示
並べ替え
6-3 Office 365 Excel
20
Office 365 の主な機能
パソコンでレポートを作成したり,発表したり,データをまとめたりで便利
21
ワード (文書作成)
エクセル (表計算)
パワーポイント
(プレゼン)
ワンノート (電子ノート)
アウトルック (電子メール)
Office 365 の種類
2種類ある.この授業では,どちらを使用しても問題
ない
22
Office 365 オンライン版
WEBブラウザで使う.
https://portal.office.com
各自の ID パスワードでサインインが必要.
Office 365 アプリ版
前もってインストールが必要
インストールでは,大量の通信が行われる.
(時間がかかる.通信費用にも注意)
Office 365 オンライン版で Excel を起動
要点 Web ブラウザで,次のページを開き,各自の ID
パスワードでサインイン
https://portal.office.com
23
Office 365 オンライン版で Excel を起動
Web ブラウザで,次のページを開く
https://portal.office.com
電子メールアドレスを入れる.「次へ」をクリック.
(例)p1234567@fukuyama-u.ac.jp
24
Office 365 オンライン版で Excel を起動
パスワードを入れ,「サインイン」をクリック
パスワードは,各自が設定したもの
Excel を使いたいときは,メニュー Excel を選ぶ
25
さまざまなメニュー
Office 365 オンライン版で Excel を起動
Excel のブックの種類を選ぶ
この授業では「新しい空白のブック」を使う
Excel の画面が開く
26
Office 365 アプリ版のインストールと
Excel の起動
【要点】 インストールは,Office 365 アプリ版を使えるよう
にするための作業(最初に行う).
そのとき,次のページを開き,各自の ID パスワードでサ
インイン
https://portal.office.com
インストールが終わったら,スタートメニュー等で Excel
起動
27
Office 365 アプリ版のインストールと
Excel の起動
Web ブラウザで,次のページを開く
https://portal.office.com
電子メールアドレスを入れる.「次へ」をクリック.
(例)p1234567@fukuyama-u.ac.jp
28
Office 365 アプリ版のインストールと
Excel の起動
パスワードを入れ,「サインイン」をクリック
パスワードは,各自が設定したもの
画面で「Office のインストール」をクリック.メニューで
Office 365 のアプリ」を選ぶ
29
Office 365 アプリ版のインストールと
Excel の起動
画面の指示に従い,インストールを行う
インストールでは,大量の通信が行われる.
(時間がかかる.通信費用にも注意)
30
次のような指示がでる
1.保存する
2.フォルダーを開く
3.実行し,その後も,画面の指示に従う
Office 365 アプリ版のインストールと
Excel の起動
Excel を使うときは,スタートメニューなどで Excel
を選ぶ
Excel のブックの種類を選ぶ
この授業では「新しい空白のブック」を使う
Excel の画面が開く
31
6-4 Excel の基本
32
オンライン版の Excel の画面(メニュー、リボン、
ワークシートなど)
33
オンライン版の Excel の画面
リボン
ワークシート
表形式で値など
が入る.
グラフの挿入
ども可能
表形式で、値や数式を並べる
メニュー
アプリ版の Excel の画面(メニュー、リボン
ワークシートなど)
34
アプリ版の Excel の画面
Excel 2019 の画面を示している)
リボン
ワークシート
表形式で値など
が入る.
グラフの挿入
ども可能
表形式で、値や数式を並べる
メニュー
Excel ワークシートシートともいう)には、表
形式で、値や数式を並べる.
グラフの挿入なども可能
Excel のワークシート
Excel のワークシートの例
Excel のブック
Excel ブックは、Excel ファイルのこと
1つあるいは複数のワークシートを、1つのブックに保存
することができる
36
Excel で保存するときに、ファイル名などを設定できる.
Excel のスタート画面
Excel 起動すると、最初スタート画面が表示される.
作成したいブックの種類を選ぶことができる.
過去の履歴の確認もできる
アプリ版
オンライン版
この授業では「新しい空白
のブック」を使う
アクティブセル
Excel での編集中のセル
38
アクティブセルでの数式の入力
入力を終わりたいので
Enter キーを押す
すると、数式が自動計算される
数式を入力したいときは、半角の「=を付ける
キーボードで「=100+200」と
打つと、アクティブセルに数式が入る
数式バーで数式の確認①
300」のところを
クリック
アクティブセルが動く
数式バーに
数式が表示される
ここで修正もできる
数式バーで数式の確認②
300」のところを
ダブルクリック
アクティブセルのところ
に数式が表示される
(ここでも修正できる)
数式バーに
数式が表示される
(ここで修正もできる)
アクティブセルでの数式の入力
入力を終わりたいので
Enter キーを押す
すると、数式が自動計算される
=B3+B4」のような数式もある
キーボードで「=B3+B4」と
打つと、アクティブセルに数式が入る
Excel の数式
Excel では、数式の頭に、半角の「=を付ける
数式は、半角文字である
数式の中には、番地(「B3」や「B4」など)を
くことができる
セルの数式と値のクリア
クリアしたいセル右クリックして、
数式と値のクリア」を選ぶ
消えた!
セルの数値と値のクリア
クリアしたいセルを範囲選択(マウスでド
ラッグ)したあと、右クリックして、「数式
と値のクリア」を選ぶ
消えた!
元に戻す操作
何かの操作を
したとする
元に戻す
ボタン
元に戻す」ボタン
を押すと元に戻る
もとに戻す操作は CTRL + Z
(コントロールキーと「Z」を同時押し)でも,でき
オンライン版の Excel でも
「元に戻す」ボタンはある
6-5 散布図(Excel を使用)
47
散布図の用途
時間変化
48
分布
横軸は時間.
散布図から,
時間変化を読み取る
横軸と縦軸は,2つの量.
散布図から,
2つの量の間の関係を見る
分布から読み取れること
49
2つの量に関係がある
横軸花びらの長さ
かたまり
かたまり
密集
密集
密集
Excel での散布図の作成手順
50
グラフ化したい部分を範囲選択
元データ
リボンで「挿入」→散布図
散布図が得られる
アプリ版の Excel
オンライン版の Excel
Excel での散布図の種類の選択
51
挿入
散布図を展開
一番左上の散布図
をクリック
アプリ版の Excel
オンライン版の Excel
挿入
散布図を展開
一番左の散布図を
クリック
52
年次 出生数 死亡数
1985 1432 752
1990 1222 820
1995 1187 922
2000 1191 962
2005 1063 1084
2010 1071 1197
0
200
400
600
800
1000
1200
1400
1600
1980 1985 1990 1995 2000 2005 2010
グラフ タイトル
出生数 死亡数
元データ
散布図
6-6 合計、平均(Excel を使用)
53
Excel で合計を求める SUM
54
=SUM(C2:C7) は,
範囲 C2 から C7
合計を求める
Excel で平均を求める AVERAGE
55
=AVERAGE(B2:B7) は,
範囲 B2 から B7
平均を求める
平均
平均は,データの合計を,データの個数割った
もの
10, 40, 30, 40 平均: 120 ÷ 4 30
複数の値の組平均を考えることもある
(10, 5), (40, 10), (30, 5), (40, 20) の平均:
合計は 120 404で割って (30, 10)
56
平均
平均は,データ集合代表とみる
ことができる場合がある
計測に誤差があるとき,
複数の計測を繰り返し,平均をとる
ことで,誤差を軽減できることも
平均を使うときの注意点
57
平均
データの分布によっては,平均では役に
立たないこともある.
(平均は万能ではない)
平均
このような平均に,
意味があるでしょうか?
次のデータについて,Excel 散布図を作る
次のデータについて,出生数 1432, 1222, 1187,
1191, 1063, 1071 合計平均を求める
58
6-7 分布、密度(Excel を使用)
(コンピューターサイエンス)
URL: https://www.kkaneko.jp/cc/cs/index.html
59
金子邦彦
ヒストグラム
ヒストグラムは,区間ごとに,データを数え上げ
もの
60
データが
何個あるのか
区間 0.6 1.1
データは 10
Excel でのヒストグラムの作成手順
61
ヒストグラム化したい選択
元データ
リボンで「挿入」→ヒストグラム
の選択
ヒストグラムが得られる
アプリ版の Excel
オンライン版の Excel
ヒストグラムから読み取れること
62
密度が高い
密度が低い
全体の傾向
山が2つある(1つではない)
データサイエンス
データサイエンスは,データから正しい知見や結論を
導くための学問
数式を使うこともあるが、それがデータサイエンス
全てではない
データから有益な情報を引き出ことが可能に。
大学生にとって、大切なスキル
63
全体まとめ
データベースは、特定の主題について整理,保存,管理
れたデータの集合体
データサイエンスは、データから有用な情報を抽出する
問分野
Excel は、計算機能(合計、平均など)、散布図やヒスト
グラムの作成など、多機能なツール.データの整理、保存
情報抽出に役立つ。
これらの技術を理解し、実践する能力を磨くことは、将来的
に大きな利点になる
64
データベースとデータサイエンスの重要性を
理解し、生活や社会の利便性向上に役立って
いることを実感。
データサイエンスを学ぶ意義。データ分析ス
キルを身につけることで問題解決能力が高ま
散布図など、データの可視化により新たな洞
を得られ、ものごとを多角的に捉えること
ができる
データ管理スキルデータ分析スキルは現代
社会で不可欠。この資料により成長。
65