RapidMiner(ラピッドマイナー)は機械学習プラットフォームです。データ可視化、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。KSKアナリティクスはRapidMinerの正規販売代理店です。

コース内容COURSE

難易度:
【発展】★★★★

PyTorch Transformer編(自然言語・画像)

PyTorch Transformer編(自然言語・画像)イメージ

Transformerとは、自然言語処理や画像認識の分野などで利用されている深層学習ネットワークの一つです。本講座はTransformer入門コースであり、概要理解、実装の確認を行なっていただくことができます。

対象者

自然言語処理や画像認識に関心のある方

所要時間

約38分

習得内容

Transformerについて学習する

コース内容

全2章 約38分

自然言語処理編 Transformerとは/BERTの仕組み/文書の前処理/文書の分類(推論)

文書の分類(学習と推論)/まとめ

画像認識編 Transformerとは/ViTの仕組み/画像の前処理/画像の分類(推論)

画像の分類(学習と推論)/まとめ

 

詳細はこちら

PyTorch 製造業における異常画像検知編

PyTorch 製造業における異常画像検知編イメージ

製造業における画像の異常検知の課題とその対処方法について学習します。異常画像検知において最高性能を示した手法PatchCoreの概要と有用性 もご説明します。

対象者

製造現場で画像の異常検知課題をお持ちの方

所要時間

約140分

習得内容

製造業における画像の異常検知の課題とその対処方法について学習する

コース内容

全5章 約140分

第1章 製造業における画像の異常検知

課題背景/異常画像検知と異常部位検出/画像の異常検知へのアプローチ

画像の異常検知システムにおける評価指標/教師なし学習による画像の異常検知

第2章 最新論文の紹介

論文概要/PatchCoreのシステム概要/この手法が優れている点/実験概要/実験結果

第3章 PatchCoreの技術詳細

Locally aware patch features/Coreset Subsampling/Anomaly ScoreとAnomaly Mapの算出

第4章 BeanTech ADにPatchCoreを適用する

実行環境/BeanTech AD Dataset /事前準備/PatchCoreの学習/PatchCoreの推論/結果の可視化

AUPROの実装/閾値の決定と可視化

第5章 公式実装のコード理解/参考文献

 

詳細はこちら

RapidMiner 異常検知編

RapidMiner 異常検知編イメージ
製造業の現場では、異常データがほとんど観測されず、正常データのみを使って異常判定を行うことを求められることが少なくありません。本講座では、異常検知に関する手法の原理を知り、RapidMinerのオペレーターを用いて異常検出を行えるようになること、閾値の設定や異常検知モデルの評価を根拠を持って行うことができるようになることを目標としています。演習に加え、手法のイメージを掴んでいただくための例題もご用意しております。

対象者

異常検知に関心がある方
異常検知に携わっている方

所要時間

※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

異常検知の手法・概要を理解する
RapidMinerのオペレータを使って異常検知モデルを作成できる
自分自身が今後関与する可能性があるプロジェクトについてモデル運用までイメージできる

コース内容

第1章 異常検知とは/距離計算(ユークリッド距離、マハラノビス距離)/異常値を検出するメリット/
データ構造と手法(HBOS、ホテリングT2統計量、k近傍法、rPCA、LOF、スライド窓による異常検知、
One Class SVM、AutoEncoder)/異常検知モデル構築の流れ/閾値の設定
第4章 異常検知(時系列データ)/アプローチ手法の検討 Windowing/
k近傍法・LOF・One Class SVMによる異常検知 演習
第5章 1. Autoencoderとは/ニューラルネットワーク/ Autoencoderの仕組み/Autoencoderを用いた
異常検知/Autoencoderを用いたノイズ除去/事例紹介/Autoencoderオペレーターの説明
2. 心拍波形データを用いた異常検知/データの説明・準備/Autoencoderでの学習/オペレーターの
設定、誤差の計算/Autoencoderの適用/Apply Model(Generic) 異常スコアの算出 閾値の検討
3. 画像(MINIST)データのノイズ除去/データの説明・準備/データの前処理/データ読み込み、形状変更
Autoencoderの学習/Autoencoderの適用/データの後処理

※その他の章は近日公開予定です。

詳細はこちら

PyTorch 異常検知編

PyTorch 異常検知編イメージ

教師なし学習の一つとして、AutoEncoderという古典的な手法があります。既に異常検知の分野では、確立された手法として実務現場での活用も進んでいます。コンテストや論文でもAutoEncoderで行った手法との比較がなされ、ベースラインとして紹介されることの多い手法となります。
本講座では、Pytorchライブラリを用いて音の異常検知を行います。ソースコードの詳細についても説明しています。
※本講座の位置付けとしましては、AutoEncoderより高精度な手法をご紹介するにあたっての基本講座となります。

対象者

異常検知についてさらに理解を進めたい方

所要時間

約120分

習得内容

AutoEncoderの基礎が理解できる

コース内容

全3章 約120分

第1章 MIMII データセットについて/ライブラリインポート/学習データとテストデータの確認/音を再生する/音声ファイルの読み込みとプロパティの確認/音声データの波形表示/メルスペクトログラム
第2章 ライブラリインポート/AutoEncoderのネットワークを定義する/AutoEncoderの動作検証
第3章 ライブラリインポートと初期設定/モデルを学習する/パラメータのロードとその他の設定/Datasetの作成/DataLoaderの作成/モデルの定義 / 損失関数と最適化手法の設定/モデルの学習/モデルの検証/閾値の設定/再構成結果の可視化/考察/演習課題

 

詳細はこちら

PyTorch GNN入門編

PyTorch GNN入門編イメージ

社会科学、自然科学、知識グラフなど多くの分野でグラフ形態の機械学習がますます注目を浴びてきています。画像や自然言語をグラフ(ネットワーク構造)として捉え、グラフやグラフ中の頂点を高精度に分類することができれば、高度な画像認識、化合物分類などへの応用が期待できます。本講座では、グラフニューラルネットワークの基本から丁寧に説明しています。

対象者

グラフニューラルネットワークに関心のある方
グラフニューラルネットワークの基礎を習得したい方

所要時間

約24分

習得内容

グラフニューラルネットワークの基礎が理解できる

コース内容

全5章 約24分

第1章 ネットワークとは/ネットワークの形状/ネットワークの活用例
第2章 ネットワークの作成/隣接行列とは/隣接行列の作成/エッジリストの作成/ ネットワークの構築と可視化
第3章 ネットワークの特徴量/次数とは/クラスタ係数とは/経路⻑とは/媒介中心性とは
第4章 ネットワークのコミュニティ/コミュニティとは/コミュニティ抽出
第5章 ノードの分類・予測/グラフ畳み込み/ネットワーク作成/分類モデルの学習/ノードのクラス予測/モデルの性能評価(Backpropagation)

 

詳細はこちら

RapidMiner MI編(Materials Informatics)

RapidMiner MI編(Materials Informatics)イメージ

近年、素材開発の分野で注目を集めているMIを活用するため、MIの課題及び機械学習上の課題双方の対処策を習得し、RapidMinerでの実装を学習する講座です。

対象者

素材の研究開発業務の方 におススメ

所要時間

約240分(予定)
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

MI特有の問題の対処法を習得する
MIに活用できるようになる

コース内容

全4回 240分(予定)

第1章 分子の特徴量を生成する/分子の特徴量の考え方/RDKitを活用する/Rapidminerによる実装の解説
第2章 混合物の特徴量をつくる/混合物の特徴量の考え方/配合データを扱いやすい形へ変換する/特徴量の計算方法の解説
第3章 予測の有効範囲の判断方法 (予定)
第4章 高次元データへの対応 (予定)

 

詳細はこちら

RapidMiner プロセスデータ分析編

RapidMiner プロセスデータ分析編イメージ

プロセスデータ(時系列データ)を用いたデータ分析に関する手法を学習いただき、 プラントで実活用できるようなモデルケースを元に学習できるコースです。

対象者

プラントの業務に携わる方 におススメ

所要時間

約300分
※実際の所要時間は、ハンズオン含め約2~3倍程度かかります。

習得内容

プロセスデータの前処理を習得する
予知保全や収率最大化に活用できるようになる

コース内容

全5回 300分

第1章 プロセスデータ(時系列データ)
の取り扱い方/時系列データのハンドリング/時系列データの可視化/時系列データの特徴量抽出
第2章 連続プラントにおける収率最大化/課題設定/データの前処理/生産量予測モデルの作成/収率最大化
第3章 プロセスデータを用いた予知保全/課題設定/データの前処理/モデルの作成/バッチプロセスへの応用
第4章 ソフトセンサー作成/ソフトセンサーとは/課題設定/回帰モデルの作成
第5章 化学プラントにおける異常検知/異常検知へのアプローチ/PCAによる異常検知/様々な異常検知手法/演習

 

詳細はこちら