アプリケーションにデータをロードせずに、直接データベース内で前処理やETL処理を行うことができ、更に複雑なSQLを記述することなく、データベースからデータを取得することができます。
- 本機能の対象のデータベースは、MySQL、PostgreSQL、Google BigQueryです。
RapidMiner(ラピッドマイナー)は機械学習プラットフォームです。データ可視化、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。KSKアナリティクスはRapidMinerの正規販売代理店です。
RapidMinerはデータ可視化(前処理)、データ加工、モデル作成、評価、運用までを一つのプラットフォームで行うことができます。
プログラミングの知識がない方でも簡単に、データサイエンティストが行っているような分析業務を今日からでもすぐに始めることができます。
アプリケーションにデータをロードせずに、直接データベース内で前処理やETL処理を行うことができ、更に複雑なSQLを記述することなく、データベースからデータを取得することができます。
20種類以上の豊富な可視化機能(3-D散布図、散布図行列、箱ひげ図、密度分布など)や統計処理でデータを調査し、データ分布や特徴を把握。欠損値や異常値など、一般的なデータ品質の問題を特定して修正します。
様々なデータ加工機能(データ統合、フィルタリング、ソート、集計など)、特徴量の選択、特徴量の生成(標準化、自動最適化、次元圧縮、主成分分析など)で精度の高いデータ加工・クレンジングを行います。
素早く簡単に前処理を行う「Turbo Prep」を使うと、これまで膨大な時間がかかっていたデータ前処理を劇的に短縮することができます。
150を超える分析アルゴリズム(回帰分析、クラスタリング、決定木、サポートベクターマシン、アンサンブル学習、ディープラーニングなど)でより良いモデルを効率的に構築します。
RapidMiner上でPythonやRとの連携も可能です。
自動的にモデルを構築・構築する「Auto Model」を使うと、マウスを使った4クリックで予測モデルを簡単に構築できます。
交差検証、分割検証でモデルの精度を確認します。
過大評価、過小評価することなく、実際の運用に取り入れられるパフォーマンスを確認します。
様々なパフォーマンス指標:
正答率(Accuracy)、適合率(Precision)、 再現率(Recall)、RMSE、AUC、 有意差検定など
パラメータの最適化:Grid(グリッドサーチ)、 Evolutionaryなど