RapidMiner(ラピッドマイナー)は機械学習プラットフォームです。データ可視化、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。KSKアナリティクスはRapidMinerの正規販売代理店です。

コース内容COURSE

キーワード絞り込み:

RapidMiner 分析結果報告編

RapidMiner 分析結果報告編イメージ

本講座では、RapidMinerで実施した分析結果をどのように報告書にまとめ、報告すれば良いかのかをご紹介します。自力で分析結果を報告書にまとめようとすると、本来報告すべき内容が漏れていたりする場合があります。本講座には、報告書のテンプレート(ppt形式)もついていますので、穴埋め形式で報告書を作成することも可能です。分析結果を広く共有し、組織としての分析力を高めるために本講座をご活用下さい。

対象者

RapidMinerの分析結果をどのように報告すれば良いか悩んでいる方
分析結果の報告方法のポイントを知りたい方

所要時間

約45分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

分析結果のまとめ方の形式を理解できる。
まとめ方の要点が分かる。

コース内容

全6章 46分

第1章 本コースの目的と受講対象者/対象とコースの目的
第2章 プロジェクトメンバーの役割/プロジェクトメンバーの構成
第3章 プロジェクトの選択/プロジェクトの選択
第4章 報告書の作成方法/タイトル、概要(サマリー)/はじめに/取得データの概要/目的と成功の指標/プロジェクトメンバーの役割/ソフトウェアの実行環境/データの準備/モデル作成、モデルの評価/運用・展開/今後の課題
第5章 リポジトリの整理方法/プロセスの整理/Project Extensionの活用/共有時の注意事項
第6章 模範的なプロジェクト報告/例)センサーデータによる油圧機器の状態監視報告書

 

詳細はこちら

RapidMiner 教師なし学習編

RapidMiner 教師なし学習編イメージ

本講座では、教師なし学習の概要と教師なし学習のRapidMinerでの活用例をご紹介します。ご自身のデータにラベル(目的変数)が存在し、教師あり学習を実施できる場合ばかりではありません。ラベル(目的変数)が存在しない場合、どのような手法があるか、RapidMinerではどのような実現方法があるのかについてご説明致します。

対象者

教師なし学習の概要と簡単なRapidMinerでの活用例を知りたい方

所要時間

52分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

教師なし学習にどのような手法があるかを理解できる。
基礎的な教師なし学習オペレーターの利用例が分かる。

コース内容

全5章 52分

第1章 教師なし学習の概要/機械学習レビュー/教師なし学習代表例
第2章 相関係数/相関係数とは/Correlation Matrixオペレーター
第3章 クラスタリング/クラスタリング/k-meansクラスタリング/x-meansクラスタリング/クラスタリングオペレーター
第4章 アソシエーション分析/アソシエーション分析とは/FP-Growth/アソシエーションルール/ルールの評価
第5章 異常検知/異常検知とは/K-NN Anomaly Score/LOF/One-Class-SVM

 

詳細はこちら

PyTorch 入門編

PyTorch 入門編イメージ

Pytorchは、ディープラーニングのフレームワークの中でも近年、最も勢いのあるフレームワークです。最先端の研究(学界、産業界)でもよく使用されており、Pytorchの基礎を理解することで様々な実課題を深層学習を使ってアプローチできることになるはずです。本講座では、Pytorchの基礎を短時間でコンパクトにご説明致します。

対象者

深層学習を使って高度な分析課題を解決していきたい方におススメ

所要時間

約45分

習得内容

Pytorchライブラリの基本的内容を理解する
実際にPytorchライブラリ使って深層学習モデルを作成してみる

コース内容

全7章 約45分

第1章 テンソル(Tensor)イントロダクション/テンソル(Tensor)とは/テンソル(Tensor)作成方法/テンソル(Tensor)の演算処理
第2章 データ読み込み/Map-Styleデータ、Iterable-Styleデータ/サブクラスの作成
第3章 データの前処理/Data Augumentation(データ拡張)Random Crop/Random Erasing/Random Flip/Gaussian Blur/Random Grayscale/Color Jitter/Random Rotation/変換の組み合わせ
第4章 モデル作成/全結合層
第5章 モデル最適化/モデルの予測と損失の計算/誤差逆伝播法(Backpropagation)
第6章 モデルの保存と読み込み
第7章 モデルの改善/畳み込み層

 

詳細はこちら

RapidMiner 運用編

RapidMiner 運用編イメージ

RapidMiner AI-Hubの各機能の紹介・使い方の解説コースです。機械学習モデルの展開・運用をこれから始める、より円滑に行いたいなど、モデルの運用を課題としてお持ちの方向けとなっております。

対象者

機械学習プロジェクトのマネージャー・推進者 におススメ

所要時間

約300分

習得内容

RapidMiner AI-Hubの概要・操作方法を理解する
効果的な運用方法について学習する

コース内容

全7章 約75分

第1章 RapidMiner AI-Hubの全体像/RapidMiner AI-Hubを導入する意義とは/RapidMiner AI-Hubの機能/Studio無償ユーザーと有償ユーザーの違い/RapidMiner AI Hubのインストール
第2章 ユーザー登録と権限設定/権限設定/ユーザー登録/セキュリティ
第3章 Dashboardの作成/AI Hub Dashboard の概要/Dashboard(RapidMiner v9.7 以降の場合)/Web App(RapidMiner v9.6 以前の場合)
第4章 Python連携/Server Repositoryのデータソースを読み込み/Server Repositoryのプロセス実行/Server Repositoryにpandas data frame を書き込み/Jupyter lab/生成したデータをGrafanaで表示
第5章 ローカルデータのアップロードと可視化/ローカルデータのアップロード/可視化
第6章 データの読み込み/変数選択、モデル選択/モデル評価、結果の解釈/Deployment
第7章 Real Time Scoring(RTS)/Real Time Scoring (RTS) Agentの概要/RTS Agentのセットアップ/RTS Agentにプロセスの追加

 

詳細はこちら

課題創出ワークショップ研修

課題創出ワークショップ研修イメージ

データ分析プロジェクトのマネジメントをこれから行う管理者の方向けのデータ分析基礎研修です。
データ分析・機械学習の基礎知識を身に着け、
分析課題の策定やプロジェクトの管理に必要なことを学習するコースです。

対象者

機械学習プロジェクトのマネージャー・推進者 におススメ

所要時間

約75分

習得内容

機械学習の基礎を習得する
データ分析プロジェクトの管理について学習する

コース内容

全4回 約75分

第1章 データ分析基礎/教師あり学習/教師なし学習
第2章 分析課題の評価方法/実現性とビジネスインパクト/実現性の各指標の説明/課題評価ワークシート記入例
第3章 統計学と機械学習/統計学と機械学習の違い
第4章 データ分析プロジェクトの回し方/データ分析の作業フロー(CRISP-DM)/データ分析プロジェクトの3つの役割/分析プロジェクトを進める際の注意点

 

詳細はこちら

MI編(Materials Informatics)

MI編(Materials Informatics)イメージ

近年、素材開発の分野で注目を集めているMIを活用するため、MIの課題及び機械学習上の課題双方の対処策を習得し、RapidMinerでの実装を学習する講座です。

対象者

素材の研究開発業務の方 におススメ

所要時間

約240分(予定)
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

MI特有の問題の対処法を習得する
MIに活用できるようになる

コース内容

全4回 240分(予定)

第1章 分子の特徴量を生成する/分子の特徴量の考え方/RDKitを活用する/Rapidminerによる実装の解説
第2章 混合物の特徴量をつくる/混合物の特徴量の考え方/配合データを扱いやすい形へ変換する/特徴量の計算方法の解説
第3章 予測の有効範囲の判断方法 (予定)
第4章 高次元データへの対応 (予定)

 

詳細はこちら

RapidMiner Tips

RapidMiner Tipsイメージ

RapidMinerを活用する際に便利な情報を、チートシートやホワイトペーパーとして配布しています。
下記リンクに順次公開を増やしていきますので都度ご確認ください。
https://www.rapidminer.jp/materials/

対象者

初めてRapidMinerに触れる方 におススメ

内容

オペレーター集
ユースケース集
Tips集 など

詳細はこちら

プロセスデータ分析編

プロセスデータ分析編イメージ

プロセスデータ(時系列データ)を用いたデータ分析に関する手法を学習いただき、 プラントで実活用できるようなモデルケースを元に学習できるコースです。

対象者

プラントの業務に携わる方 におススメ

所要時間

約300分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

プロセスデータの前処理を習得する
予知保全や収率最大化に活用できるようになる

コース内容

全5回 300分

第1章 プロセスデータ(時系列データ)
の取り扱い方/時系列データのハンドリング/時系列データの可視化/時系列データの特徴量抽出
第2章 連続プラントにおける収率最大化/課題設定/データの前処理/生産量予測モデルの作成/収率最大化
第3章 プロセスデータを用いた予知保全/課題設定/データの前処理/モデルの作成/バッチプロセスへの応用
第4章 ソフトセンサー作成/ソフトセンサーとは/課題設定/回帰モデルの作成
第5章 化学プラントにおける異常検知/異常検知へのアプローチ/PCAによる異常検知/様々な異常検知手法/演習

 

詳細はこちら

統計学 基礎編

統計学 基礎編イメージ

機械学習を活用していくための前提知識である統計学の基礎を学習していく初心者向けの講座です。
本講座ではRapidMinerは使用しません。

対象者

初めて機械学習に触れる人 におススメ

所要時間

約110分

習得内容

統計学の基礎を習得する

コース内容

全4回 約110分

第1章 記述統計/平均・中央値・最頻値/四分位数/標準偏差と正規分布
第2章 相関/相関と因果/相関と因果関係の向き
第3章 中心極限定理/標本数による標本平均分布の変化/⺟集団と標本平均分布
第4章 推定と検定/点推定と区間推定/帰無仮説と対立仮説/両側検定と片側検定

 

詳細はこちら

可視化・クレンジング編

可視化・クレンジング編イメージ

アルゴリズムを使用した機械学習の分析前の重要なプロセスであるデータの可視化と前処理に関する講座です。
データのグラフ化についてや前処理の技法について詳しく学んでいきます。

対象者

初めて機械学習に触れる人 におススメ

所要時間

約160分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

データ可視化の基礎を習得する
基礎的なデータ前処理が出来るようになる

コース内容

全3回 約660分

第1章 基本統計量・可視化/可視化の目的(重要性)/ヒストグラム/棒グラフ/散布図/相関行列
第2章 テーブル操作/テーブルの結合/行列の入れ替え
第3章 クレンジング/データ加工・クレンジングの重要性/欠損値の削除・置換/外れ値の削除・置換/列の削除・追加/正規化

 

詳細はこちら

深層学習編(画像・テキスト)

深層学習編(画像・テキスト)イメージ

RapidMinerを使った深層学習について複数の講座で学習出来るコースです。
時系列解析、画像認識、テキストマイニングといった課題に深層学習を活用出来るように学習していきます。

対象者

深層学習を身に付けたい人 におススメ

所要時間

約260分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

深層学習の基礎を習得する
深層学習を使って、時系列解析・画像認識・テキストマイニングが出来るようになる

コース内容

基礎理解編 /全10回 約150分

はじめての深層学習 イントロダクション 学習内容/学習ゴール
第1章 深層学習とは/ビジネスでの活用例/深層学習の位置づけ/ニューラルネットワーク/ディープ・ニューラルネットワーク
第2章 Deep Learning Extension/Extensionの追加/多層パーセプトロンの作成/学習条件の設定/実行結果
第3章 手書き文字画像の識別/CNNの作成/実行結果
第4章 センサーデータの異常検知/部分時系列の作成/MLPモデルの作成/実行結果/異常検知の考え方
第5章 まとめ
はじめてのテキストマイニング 第1章 テキストマイニングとは/ビジネスでの活用例/技術体系
第2章 テキストの前処理/自然言語処理/形態素解析/前処理フロー
第3章 テキストの分析/単語の出現分布/階層的クラスタリング/共起ネットワークの構築
第4章 まとめ/付録

実践応用編 /全17回 約110分

画像認識 第1章 事前準備/Extensionのインストール
第2章 CNNの基礎/畳み込み層の計算/プーリング層の計算
第3章 画像の前処理/前処理の手順/データ構造の確認/画像サイズを揃える
第4章 被写体の識別/モデル学習の手順/CNNの作成/モデル精度の確認
第5章 画像の水増し/グレースケール変換/画像の反転/画像の回転
第6章 まとめ
時系列解析 第1章 事前準備/Extensionのインストール
第2章 RNNの基礎/LSTM:長短期記憶
第3章 時系列の前処理/前処理の手順/部分時系列の作成/データ形式をテンソルへ変換
第4章 時系列の予測/作成するLSTMの構造/LSTMの作成/実行結果
第5章 教師ラベルの作成/ラベル作成の考え方/異常フラグの作成/実行結果
第6章 まとめ/実行結果
テキスト分類 第1章 事前準備
第2章 テキストの前処理/前処理の手順/形態素解析の実行
第3章 テキストのクラス予測(1)/モデル学習の手順/TF-IDFによる重み付け
第4章 テキストのクラス予測(2)/文書分類モデル学習/モデル精度の確認
第5章 まとめ

 

詳細はこちら

IoT編

IoT編イメージ

IoT時系列センサデータの分析方法について、実際に製造業様の分析に長く取り組んできた弊社のノウハウを盛り込んだ学習コースです。
時系列データの前処理に関する内容も盛り込まれており、より実務に活用できる講座です。

対象者

IoTデータを活用したい人 におススメ

所要時間

約660分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

IoTデータの前処理方法を習得する
IoTデータから予測分析出来るようになる

コース内容

全15回 約660分

第1章 データ分析と機械学習/データ分析プロジェクトの進め方/教師あり学習/教師なし学習/強化学習
第2章 機械学習ことはじめ/機械学習を正しく使うために
演習・事前準備 演習の為のRapidMiner事前準備
第3章 RapidMiner の使い方/RapidMinerの基本
第4章 時系列データ分析の基礎/時系列データの特徴量抽出/Time seriesオペレーター
第5章 分類問題/決定木分析とは
第6章 モデルの精度と評価/分割検証/交差検証モデルの精度
実践ケース1 モータの診断/データの分割/特徴量の作成
実践ケース2 波形データから特定区間の切り出し/区間IDの作成/区間ごとに特徴量をもとめる
第7章 回帰分析/単回帰分析/重回帰分析/多重共線性
実践ケース3 ロボットの予防保全/欠損値の線形補完/説明変数同士の関係性
第8章 K近傍法(k-NN)による分類/変数選択/標準化
第9章 その他の分類モデル/ロジスティック回帰/サポートベクターマシン
第10章 クラスタリング/階層型クラスタリング/非階層型クラスタリング
第11章 ニューラルネットワークとディープラーニング/ニューラルネットワークの仕組み/ディープラーニング/畳み込み/プーリング

 

詳細はこちら

回帰編

回帰編イメージ

回帰問題に特化して、機械学習とRapidMinerの基礎が学習出来る初級コースです。
分析をビジネスに活用するシーンにおいて出番の多い回帰分析を入門から、様々なアルゴリズムを解説する応用までを学ぶことができます。

対象者

初めて機械学習に触れる人、数値予測がメインの人 におススメ

所要時間

約95分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

機械学習の概要、特に回帰分析を理解する
RapidMinerの基本的な使い方を習得する

コース内容

全3回 約95分

第1章 単回帰/重回帰/多項式回帰/交互作用項の追加
第2章 回帰におけるオーバーフィッティング/リッジ回帰/ラッソ回帰
第3章 k近傍法による回帰/決定木の回帰への拡張(回帰木、ランダムフォレスト、勾配ブースティング回帰木/サポートベクターマシンによる回帰

 

詳細はこちら

基礎編(Pt1/Pt2)

基礎編(Pt1/Pt2)イメージ

機械学習の概要とRapidMinerの基本的な使い方が習得出来る初級コースです。
『顧客データを分析して離反を防ぐ』というケーススタディでRapidMinerの基礎を学習します。

対象者

初めて機械学習に触れる人 におススメ

所要時間

Pt1 約140分
Pt2 約250分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

機械学習の概要を理解する
RapidMinerの基本的な使い方を習得する

コース内容

Pt1 / 全5回 約140分

第1章 本コースの概要/アナリティクスとは何か/今回扱うデータ/CRISP-DMモデルとは/RapidMinerの操作
第2章 データの準備/データの前処理/変数の定義/プロセスの保存/2章まとめ
第3章 モデリングの概要/k-nnとは/モデルの適用/3章まとめ
第4章 モデルの検証/パフォーマンスの見方/クロスバリデーションとは標準化とは/4章まとめ
第5章 第5章:線形回帰とは/郵便番号のより良い表現/決定木とは/まとめ

Pt2 / 全6回 約250分

第1章 本コースの概要/アナリティクスとは何か/今回扱うデータ/CRISP-DMモデルとは/RapidMinerの操作
第2章 結合の理解/離反データの結合/目的変数の生成/性別情報の結合/データの集計/2章まとめ
第3章 データの回転-ピボット/行方向の集計/属性でループ/属性名の削除/年齢の算出/最後の仕上げ/解約データに含まれる顧客データを削除
第4章 ニューラルネットワークの概要/学習係数/局所最適点とモメンタム/不均衡データ/不均衡データの処理/4章まとめ
第5章 サポートベクターマシン概要/カーネルトリック/サポートベクターマシンまとめ/パラメータ最適化/5章まとめ
第6章 変数選択/変数増加法/変数増加法の計算量/Speculative Rounds/変数減少法/変数選択の検証/変数選択後のシナリオ/第6章のまとめ

詳細はこちら