AI・機械学習 アスリート塾(3日版)
機械学習などの先進技術を用いた提案ができる人材を育成するためには、まず、その先進技術が「どのようなものか」と言うことを理解しないことには、何も始めることは出来ません。また、単なる技術入門書による学習や、クラウド上の各種簡易サービス(AzureMLなど)の体験セミナーは、機械学習などの先進技術を利用した提案が出来る人材育成のためのものではありません
今回のカスタムPBL(Project Based Learning)は「機械学習についての基本的な理解をしたうえで、その技術を利用した企画を策定してみる」という一連のプロジェクト(流れ)を3日間で凝縮して行うものです。これにより、受講者が機械学習を活用したプロジェクトの候補となる案を策定できるようにすることを目的としています
今回のカスタムPBL受講者が中心となり、次ステップであるターゲッティング(業務に活用する先進技術の、適用範囲や可能性検証などの計画)や応用展開(実際のプロジェクトの開始)へと進んでいくことが出来ます
3日
- プログラム経験(1年程度以上)があることが望まれます
- 統計学や数学に関して専門的・体系的な教育などの前提条件は、特にありません
【事前学習】
以下のテーマに対して、推薦図書(Rによるデータマイニング入門/Ohmsha/山本義郎, 藤野友和, 久保田貴文)などを読んで事前に知識を習得する
- 統計に関する用語の理解
- R言語の基本的な使い方の理解
- データ分析プロセスの全体像を理解し、データ分析の手順を説明できる
- データ分析でよく使われる統計手法と機械学習の用語を理解し、統計と機械学習の違いを説明できる
- 機械学習の基礎的な用法・手順を理解し、概要を説明できる
- R言語の基礎的な操作方法を理解し、データの可視化ができる
- 数値データを使った機械学習のモデルを説明できる
- カテゴリデータを使った機械学習のモデルを説明できる
- 教師あり機械学習の分析プロセスと適用事例を説明できる
- 教師なし機械学習の分析プロセスと適用事例を説明できる
- 分析精度について説明できる
- 機械学習を使った業務改善、新サービスが企画できる
【第1日目】
1.開会式
1)本合宿についてご説明
2)オリエンテーション(自己紹介等)
‐ 個人の目標を設定
3)注意事項等の説明
2.統計手法・機械学習についての講義
1)基本用語の説明
‐ 統計学と機械学習
‐ データマイニング対ビッグデータ解析
‐ 深層学習(ディープラーニング)
2)機械学習をビジネスに活用する
‐ いい活用のためにヒント
3)機械学習の基本
‐ 機械学習のフロー
‐ 用語:モデル、説明変数
‐ 基本的なアルゴリズムのイメージ
4)Rについて
‐ 機械学習用ツールについて
‐ Rとは
3.環境設定・Rの基本・統計手法ハンズオン
1)Rの基本的な使い方
‐ 電卓的に使う
‐ 変数や関数の定義してみる
‐ 配列を操作してみる
‐ パッケージについて
‐ 統計関数を使ってみる
‐ 外部データを入力、加工してみる
2)演習
‐ データ型について
3)はじめての回帰分析
‐ 線形回帰分析
4) 演習
‐ 回帰分析結果の可視化
‐ 推定精度の検証
‐ 予測精度の改善
3.環境設定・Rの基本・統計手法ハンズオン
1)Rの基本的な使い方
‐ 電卓的に使う
‐ 変数や関数の定義してみる
‐ 配列を操作してみる
‐ パッケージについて
‐ 統計関数を使ってみる
‐ 外部データを入力、加工してみる
演習
‐ データ型について
2)はじめての回帰分析
‐ 線形回帰分析
演習
‐ 回帰分析結果の可視化
‐ 推定精度の検証
‐ 予測精度の改善
演習
【第2日目】
4.機械学習事始めハンズオン (1/4)
1)Rを用いた回帰分析 非線形回帰分析
‐ 演習の準備
‐ MARS
‐ サポートベクター回帰(SVR)
演習
‐ モデル木
‐ 遺伝子プログラミング
演習
5.機械学習事始めハンズオン (2/4)
1)分類問題
‐ 離散的なデータの取り扱い
‐ 解析用データの準備
2)線形分類
‐ 2値2次元線形分類
‐ 多値線形分類
3)非線形分類
‐ データセットの準備
‐ 比較のための線形分類
‐ サポートベクタマシン(SVM)
‐ 決定木(分類木)
演習
‐ ランダムフォレスト
4)オーバフィット(過剰適合、過学習)
‐ オーバフィットとは
演習
5)k近傍法による分類
6.機械学習事始めハンズオン (3/4)
1)特徴選択
‐ 特徴選択の目的
‐ 線形回帰モデルによる特徴選択
‐ MARSによる説明変数影響解析
演習
2)ニューラルネットワーク
‐ ニューラルネットワークとは?
‐ 初めてのニューラルネットワーク
【第3日目】
7.機械学習事始めハンズオン (4/4)
1)次元削減法
‐ 変数選択
‐ 主成分分析による説明変数組み合わせ
‐ tSNEによる写像
2)教師なし機械学習による特徴選択
‐ 階層的クラスター分析(HC)
‐ k平均法
演習
‐ 自己組織化写像
8.機械学習まとめ
‐ これまで学習した分析モデル・手法についてのおさらい
‐ カテゴリーデータと各モデルの相性
‐ その他手法について
‐ 分析手順のおさらい
9.機械学習の適用検討(企画フェーズ)
‐ データ分析のよくある適用例
‐ 業務での適用のアイデア
ワークショップ