テキスト・画像・音声データ分析

西川仁/佐藤智和/市川治・著 清水昌平・編
シリーズ:
データサイエンス入門シリーズ

テキスト・画像・音声データ分析

発行
2020/05/21
サイズ
B5変
ページ数
240
ISBN
978-4-06-518804-0
定価
3,080円(税込)
在庫
在庫あり

書籍を購入する

定価
3,080円(税込)

電子書籍

※価格は紙の本と異なります。また、書店によって価格が異なる場合もあります。※配信開始日は各書店により異なります。書店によっては取り扱いのない作品もございます。あらかじめご了承ください。
電子書籍版を見る

内容紹介

社会で求められるデータサイエンスの応用3分野を、各分野の専門家が平易な文章と多彩な図で説く。
・初歩の動機づけから基本原理、さらには社会実装までを見すえる
・学んだことが、すぐに試せる。豊富なPythonコードを収録
・練習問題を多数掲載し、講義テキストに最適。初学者の自学自習にも役立つ

目次

目次

第I部 テキスト分析(西川仁)

第1章 テキスト分析概論

1.1 自然言語処理とは
1.2 自然言語処理の歴史
1.3 第I部の構成

第2章 言語資源と言語モデル

2.1 辞書
2.1.1 ターミノロジー
2.1.2 シソーラス
2.1.3 オントロジー
2.2 コーパス
2.3 言語モデル
2.3.1 言語モデルとは
2.3.2 Nグラム言語モデル
2.3.3 言語モデルの評価
2.3.4 まとめ

第3章 基礎技術

3.1 形態素解析
3.2 構文解析
3.3 意味解析
3.3.1 述語項構造解析
3.3.2 語義曖昧性解消
3.4 談話解析
3.4.1 照応解析
3.4.2 共参照解析
3.4.3 修辞構造解析

第4章 応用技術

4.1 情報抽出
4.2 情報検索
4.2.1 ベクトル空間モデル
4.2.2 情報検索の評価
4.3 評判分析
4.4 機械翻訳
4.5 自動要約
4.6 対話システム
4.7 質問応答システム

第II部 画像分析(佐藤智和)

第1章 画像解析の概要

1.1 画像解析による実世界情報の抽出
1.2 画像解析の進化と応用
1.3 画像解析の分類

第2章 画像のデータ表現

2.1 人の視覚とデジタルカメラによる撮影
2.2 画素の標本化
2.3 画素値の量子化
2.4 色空間
2.5 画像座標とデータ表現
2.6 PythonとOpenCVによる画像データの読み書き

第3章 二次元画像解析

3.1 画像認識
3.2 深層学習による画像認識
3.3 画像ヒストグラム
3.4 明度変換
3.5 フィルタ処理
3.6 特徴点検出
3.7 特徴量抽出
3.8 対応点探索

第4章 三次元画像解析

4.1 三次元情報の抽出
4.2 順変換過程とカメラパラメータ
4.3 世界座標系からカメラ座標系への変換
4.4 回転行列の表現
4.5 カメラ座標系間の座標変換
4.6 画像面への投影
4.7 レンズ歪み
4.8 投影座標から画像座標への変換
4.9 内部パラメータ行列
4.10 カメラ外部パラメータ(位置・姿勢)の推定
4.11 物体の三次元位置の推定

第5章 三次元構造の推定アルゴリズム

5.1 2眼ステレオ法
5.2 多眼ステレオ法
5.3 視体積交差法
5.4 Structure from Motion法

第III部 音声データ分析(市川治)

第1章 音声認識の全体像

1.1 ピアノは,なぜ「あいうえお」を喋れないのか?
1.2 音声認識器への入力
1.3 音素ごとの尤度を出すモデル(音響モデル)
1.4 文全体の音響尤度
1.5 音声認識における単語並びの仮説
1.6 音声認識のための言語モデル
1.7 音声認識器の全体像
1.8 音響モデルと言語モデルの綱引き
1.9 パス探索

第2章 音声データの特徴量

2.1 波形データ
2.2 スペクトルデータ
2.3 フィルターバンク
2.4 特徴量の正規化
2.4.1 加法性歪の除去
2.4.2 乗法性歪の補正
2.5 動的特徴量
2.6 特徴量の標準化

第3章 音響モデル

3.1 コンテキスト依存音素
3.2 音素ステート
3.3 音素クラスタリング
3.4 音響モデルの学習と実行(ニューラルネットワーク)
3.4.1 全結合ニューラルネットワーク
3.4.2 畳み込みニューラルネットワーク
3.4.3 ボトルネック層の導入
3.5 音響モデルの学習と実行(GMM)
3.6 隠れマルコフモデル(HMM)
3.6.1 HMMの構造
3.6.2 HMMの学習
3.6.3 HMMの実行

第4章 言語モデル

4.1 単語のつながりを予測する
4.2 N-グラム
4.3 N-グラムの補間
4.4 N-グラム言語モデルを使用した単語列の出現確率の計算
4.5 言語モデルの性能測定

第5章 デコーダ

5.1 ベイズの定理とベイズの識別器
5.2 音響モデルと言語モデルの結果の統合
5.3 ニューラルネットワーク音響モデルをHMM で使用するための変換
5.4 効果的な候補の絞り込み

第6章 音声認識技術の発展

6.1 音響モデルの発展
6.1.1 ニューラルネットワーク音響モデルの進んだ学習方法
6.1.2 リカレントニューラルネットワーク
6.1.3 知識蒸留
6.1.4 識別学習
6.1.5 転移学習
6.1.6 特徴量の進化
6.2 言語モデルの発展
6.3 End-to-End音声認識モデル
6.4 学習データの発展