RapidMiner(ラピッドマイナー)は機械学習プラットフォームです。データ可視化、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。KSKアナリティクスはRapidMinerの正規販売代理店です。

RapidMiner Studio製品情報

RapidMinerはデータ可視化(前処理)、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。
プログラミングの知識がない方でも簡単に、データサイエンティストが行っているような分析業務を今日からでもすぐに始めることができます。

RapidMiner Studio 参考図

インデータベース処理

インデータベース処理クリックして拡大タップして拡大

アプリケーションにデータをロードせずに、直接データベース内で前処理やETL処理を行うことができ、更に複雑なSQLを記述することなく、データベースからデータを取得することができます。

  • 本機能の対象のデータベースは、MySQL、PostgreSQL、Google BigQueryです。

データ可視化

データ可視化クリックして拡大タップして拡大

20種類以上の豊富な可視化機能(3-D散布図、散布図行列、箱ひげ図、密度分布など)や統計処理でデータを調査し、データ分布や特徴を把握。欠損値や異常値など、一般的なデータ品質の問題を特定して修正します。

データ加工

データ加工クリックして拡大タップして拡大

様々なデータ加工機能(データ統合、フィルタリング、ソート、集計など)、特徴量の選択、特徴量の生成(標準化、自動最適化、次元圧縮、主成分分析など)で精度の高いデータ加工・クレンジングを行います。
素早く簡単に前処理を行う「Turbo Prep」を使うと、これまで膨大な時間がかかっていたデータ前処理を劇的に短縮することができます。

モデリング(機械学習)

モデリング(機械学習)クリックして拡大タップして拡大

150を超える分析アルゴリズム(回帰分析、クラスタリング、決定木、サポートベクターマシン、アンサンブル学習、ディープラーニングなど)でより良いモデルを効率的に構築します。
RapidMiner上でPythonやRとの連携も可能です。
自動的にモデルを構築・構築する「Auto Model」を使うと、マウスを使った4クリックで予測モデルを簡単に構築できます。

検証・最適化

検証・最適化クリックして拡大タップして拡大

交差検証、分割検証でモデルの精度を確認します。
過大評価、過小評価することなく、実際の運用に取り入れられるパフォーマンスを確認します。

様々なパフォーマンス指標:
正答率(Accuracy)、適合率(Precision)、 再現率(Recall)、RMSE、AUC、 有意差検定など
パラメータの最適化:Grid(グリッドサーチ)、 Evolutionaryなど

モデル適用

モデル適用クリックして拡大タップして拡大

構築したモデルに新しいデータを適用して、予測分析を実行します。データが適切に合致したモデルはより正確な予測を算出します。

自動化&プロセス制御

自動化&プロセス制御クリックして拡大タップして拡大

データアクセスからモデル適用までの一連のプロセスをシステム化し、評価・改善を反映させながらモデルの精度を上げていきます。

プロセスのエクスポート

プロセスのエクスポートクリックして拡大タップして拡大

プロセスをXMLに出力し、RapidMinerに組み込みできます。