Spark Reccomend engine
Spark MlLib (Batch)
Apach Kafka + Spark Streaming (Real time)
Sparkの機械学習用のライブラリ
ML Algorithms: 回帰、クラスタリング、協調フィルタリングなどの一般的な学習アルゴリズム
Featurization: 特徴抽出、変換、次元削減、選択
Pipelines: MLパイプラインの構築、評価、チューニングのためのツール
Persistence: モデル、パイプラインの保存、ロードアルゴリズム
Utilities: 線形代数、統計、データ処理など
規則正しくされた交互の最小二乗法で訓練された行列因子分解モデル
交互最小二乗法行列因子分解
評価を表すコンパクトなクラス
大規模ストリームデータ処理エンジン
分散メッセージングシステム