今日から使える機械学習
#機械学習#データサイエンス#決定木
0.5日間~1日間
~機械学習、データ分析初心者が知っておきたい決定木~
今日から使える機械学習
~決定木による回帰予測と因子の分析の実習~
決定木とは、データを分かりやすく分類して予測モデルを構築することができる手法です。少ないデータ数でも回帰や分類にも活用ができ、比較的簡単で初心者にも取り組みやすいことが特徴です。
本講座ではこれからエンジニアリングに機械学習を取り入れていきたい、興味がある、もしくはやってみたがよくわからないという方を対象に数ある手法の中から、まずはこの決定木の手法について理解し、ご自身の業務、実データにすぐに試してもらえることを目標に講義を進めます。
担当講師 | 近畿大学 和田義孝氏 |
対象者 | ・機械学習に興味がある、やってみたい、やってみたけどよくわからないという設計者、実験担当者、CAE専任者など ・統計と重回帰の基礎知識(ガウス分布、平均、分散、決定係数などの基本事項)を有している方 |
講座レベル | 基礎~中級 |
講座形態 | 座学+演習 Jupyter Notebook形式のPythonプログラムを配布します。 Google Colaboratoryでも利用可能 ※ご希望に応じて演習に実データを利用することが出来ます。(応事前相談) |
- 学習ポイント
・決定木について理解する
・因子の重要度を用いた現象を理解する。
・データの適切さを知るための交差検証を実践する。
・決定木を用いた分析手法を設計、実験、CAEなど自身の取り扱うデータへどのように適用していくかのイメージを掴む。
タイムテーブル例
時間 | 内容 |
13:00~14:30 | 1. 機械学習とは |
2. データ量と機械学習の性能の関係 | |
3. 少ないデータしかない現状 | |
4. 決定木とは | |
5. 決定木で出来ること | |
6. 重要度とは 分析に使うことのできる重要な分析パラメータ | |
7. 決定木のアルゴリズム I.ランダムフォレスト(アンサンブル学習) II.XGBoost(Boosting) III.LightGBM(Boosting) | |
8. データの準備と予測結果の評価の基本 | |
14:30~14:45 | 休憩 |
14:45~16:00 | 12. 実習 JupyterNotebookの解説(実行方法と保存、データの確認などの基本事項) 基本:1入力1出力 基本:3入力1出力(ベクトル入力) A)データの量と予測精度 重要度の確認、データ量の確認、予測精度(決定係数等)の確認 B)d. データの量とハイパーパラメータの関係 重要度の確認、データ量の確認、予測精度(決定係数等)の確認 C)e. 各手法の比較 手法による違いを上記の確認事項を通じて調べる |
16:00~16:15 | 休憩 |
16:15~16:45 | 実際のデータによる学習(社内で共有できるデータがあればお持ちいただいてもよい、なければこちらで準備した実データを用いる) |
16:45~17:00 | まとめおよび質疑 |
※内容は予告なく変更となる場合がございます。
※16時15分~の実習データについては、ケースバイケースで相談となります。