データサイエンスのためのデータベース

吉岡真治/村井哲也・著 水田正弘・編
シリーズ:
データサイエンス入門シリーズ

データサイエンスのためのデータベース

発行
2020/04/16
サイズ
B5変
ページ数
160
ISBN
978-4-06-519310-5
定価
2,640円(税込)
在庫
在庫あり

書籍を購入する

定価
2,640円(税込)

電子書籍

※価格は紙の本と異なります。また、書店によって価格が異なる場合もあります。※配信開始日は各書店により異なります。書店によっては取り扱いのない作品もございます。あらかじめご了承ください。
電子書籍版を見る

内容紹介

データベースを分析・活用する読者を想定し、SQLによるデータ操作 から、関係データベースの基本とその使い方、データの可視化、NoSQL、関係 データベースを用いた実践的なデータ分析事例を解説した。

目次

第1章 はじめに
1.1 データサイエンスのためのデータベース
1.2 データベースの歴史
1.2.1 関係データベース
1.2.2 NoSQL

第2章 関係データベースの基本
2.1 データの関係モデル
2.1.1 「関係」の概念とそれに基づくデータの表現
2.1.2 データのリレーションによる表現
2.1.3 リレーションのテーブルによる表示
2.1.4 テーブルに関する注意
2.1.5 関係スキーマ
2.1.6 インスタンス
2.1.7 タプルからの成分の切り出し
2.1.8 第1正規形
2.1.9 超キーと候補キー,主キー
2.2 整合性制約
2.2.1 ドメイン制約
2.2.2 主キー制約
2.2.3 外部キーと参照整合性制約
2.3 関係代数
2.3.1 テーブルからのデータ検索
2.3.2 関係代数の集合演算
2.3.3 「関係代数」独自の演算
2.3.4 実テーブルと導出テーブル,ビューテーブル

第3章 SQLと正規化
3.1 SQL
3.1.1 データ検索
3.1.2 データベースの定義・更新・管理
3.2 正規化
3.2.1 更新時異常
3.2.2 関数従属性
3.2.3 完全関数従属性と第2正規形
3.2.4 推移従属性と第3正規形
3.2.5 無損失分解

第4章 データの可視化と分析
4.1 データの可視化による分析
4.2 データベースの可視化
4.2.1 グラフによるデータベースの可視化
4.2.2 表計算ソフトとSQLを用いたデータベースの可視化
4.2.3 データベース可視化ソフトの利用
4.3 OLAP
4.3.1 OLAPの考え方
4.3.2 エクセルのピボットテーブルを用いたOLAP的分析

第5章 NoSQL
5.1 RDBMSの問題とNoSQLの分類
5.2 さまざまなNoSQLデータベース
5.2.1 Key-Value Storeデータベース
5.2.2 列指向データベース
5.2.3 ドキュメント指向データベース
5.2.4 RDFデータベース
5.2.5 グラフデータベース
5.2.6 その他のNoSQLデータベース
5.3 まとめ

第6章 実践的データ分析事例
6.1 RDBMSを用いたWikipediaダンプデータの分析
6.1.1 Wikipediaダンプデータ
6.1.2 言語間リンクを用いた翻訳辞書の構築
6.1.3 リダイレクトを用いた異表記辞書の構築
6.2 その他のソフトウェアと組み合わせたWikipediaダンプデータの分析
6.2.1 Wikipediaの情報を用いた単語の曖昧性解消
6.2.2 実験用データの構築
6.2.3 実験結果とその分析