<機械学習及びビッグデータの概要>
・機械学習とビッグデータ
・ビッグデータの概要
Hadoop、Spark、SparkMLlib
・機械学習の概要
データ分析のアプローチ、機械学習の手法
<Hadoop及びSpark MLlibのシステム構成例>
・Hadoop/Sparkのシステム構成要素
Hadoop、Hive、Spark、PySpark、jupyter notebook
・Hadoop/Sparkのシステム構成例・環境構築
システム構成例、環境構築の流れ
<機械学習システムの開発プロセス>
・機械学習システムの開発プロセスフロー
CRISP-DM、モデル開発の流れ
・モデル開発のためのツール
基礎集計と可視化、特徴量処理、予測精度
<Spark MLlibを使った機械学習の紹介>
・Spark MLlibでの機械学習
分類と回帰、クラスタリング、協調フィルタリング
・Spark MLlibでの機械学習の応用
MLPipelines、アルゴリズムの実装