Clustering

  Machine Learning

Clusteringは、正解データを用意することなく、データを分類することができます。教師なし学習の一つです。

処理の実行

ImportのFree Formatでデータを展開します。量的データ(数値データ)は全て分析の対象になりますので、不要な列があれば削除してください。質的データは(下の例ではF列)、自動的に無視されますのでそのままで問題ありません。

Clusteringを起動します。Partition Countでクラスタ数を指定します。Distanceで距離のアルゴリズムを指定し、Runで実行します。

出力ファイル

出力ファイルのCluster列に(下の例ではJ列)、推定されたクラスタ番号が貼り付きます。予め正解データを質的データで残しておけば(下の例ではF列)、クラスタ分析の結果と比較することができます。

アルゴリズム

Distance Matrix Calculate

k-Medoids