手を動かしながら学ぶ ビジネスに活かすデータマイニング
価格: ¥0
(概要)
人気ブログ「銀座で働くデータサイエンティストのブログ」を運営する現役データサイエンティスト(Data Scientist)である著者が,Rを使ったデータマイニングの基礎から最新の手法まで,ビジネス現場での具体例を交えながらやさしく解説します。技術評論社のサイトからダウンロードできるサンプルデータを用いて実際に手を動かしながら学習していく方式なので,データもRも「使える」力を確実に身に付けることができます。
(こんな方におすすめ)
・データマイニングの入門者
・統計分析ツール「R」を使ってみたい方
(目次)
第1章 データマイニングとは
1-1 データマイニングって一体何?
1-2 データマイニングの両輪:統計学と機械学習
1-3 これだけは覚えておきたい基礎知識
1-4 大事なのは「イメージ」できるようになること
1-5 この本を読み進める上での注意点
第2章 Rを使ってみよう
2-1 Rとは
2-2 Rのインストール
2-3 RStudioのインストール
2-4 Rでデータ操作をしてみよう
2-5 CRANパッケージを使ってみよう
2-6 Rによるコーディングについて
2-7 formula式を覚えよう
[コラム]サンプルデータのダウンロードについて
第3章 その2つのデータ,本当に差があるの? ~仮説検定~
3-1 それが偶然に起きたことか必然的に生じたことかを判定する=仮説検定と有意確率
3-2 t検定:いわゆる「有意差」を見つける代表的なメソッド
3-3 独立性の検定(カイ二乗検定):施策の効果があったかどうかを見る
3-4 順位和検定:分布同士の「ずれ」を見る
第4章 ビールの生産計画を立てよう~重回帰分析~
4-1 ある「目的となるデータ」をさまざまな「独立な周辺データ」から「説明」したい=回帰
4-2 重回帰分析=複数の説明変数でひとつの目的変数を説明する
4-3 重回帰分析をやってみよう
4-4 「偏回帰係数」と「相関係数」の違いに注意
[コラム]どれくらいの個数のデータを集めれば良い?
第5章 自社サービス登録会員をグループ分けしてみよう ~クラスタリング~
5-1 「何かの基準に基づいて似たもの同士をまとめる」=クラスタリング
5-2 Rで利用できるクラスタリング手法たち
5-3 eコマースサイトの顧客データでクラスタリングしてみよう
第6章 コンバージョン率を引き上げる要因はどこに? ~ロジスティック回帰~
6-1 「一般化線形モデル」とは
6-2 パーセンテージのように「上限と下限が決まっている」場合のロジスティック回帰
6-3 テストの合否のように「Yes/No(1 or 0)の二値で現れる」場合のロジスティック回帰
6-4 実際にロジスティック回帰をやってみよう
[コラム] データ分析の勉強会に参加してみませんか?
第7章 どのキャンペーンページが効果的だったのか? ~決定木~
7-1 決定木から始める機械学習
7-2 「できるだけ外れているものをよけるように」分岐条件の順番を決めていく=決定木
7-3 決定木を試してみよう
7-4 決定木で回帰分析をすると「回帰木」になる
[コラム] Rの次は何を勉強するべき?
第8章 新規ユーザーの属性データから今後のアクティブユーザー数を予測しよう ~SVM/ランダムフォレスト~
8-1 機械学習とはどういうもの?
8-2 サポートベクターマシン(SVM):「美しく」分類する機械学習の王様
8-3 ランダムフォレスト:コンピューターの進歩が生み出した機械学習の若きスター
8-4 新規ユーザーの属性データから,1ヶ月後のアクティブユーザー数を予測してみよう
第9章 ECサイトの購入カテゴリデータから何が見える? ~アソシエーション分析~
9-1 「Xが起きればYも起きる」をモデリングする
9-2 ECサイトの購入カテゴリデータからおすすめカテゴリ導線のプランを考えてみよう
[コラム]レコメンデーション(推薦)システムとの関係
第10章 Rでさらに広がるデータマイニングの世界 ~その他の分析メソッドについて~
10-1 分散分析
10-2 一般化線形モデルとその応用
10-3 主成分分析,因子分析とその発展形
10-4 機械学習のその他の手法と発展形
10-5 グラフ理論・ネットワーク分析
10-6 計量時系列分析
10-7 ベイジアンモデリング
10-8 その他の新旧メソッドたち