企業向け研修
本講義では、データを類似度に基づいて複数の集団に分割する手法であるクラスター分析について学びます。 クラスター分析は、顧客・商品の分類に利用されることが多く、主にマーケティング領域で活用されています。また、遺伝子配列の解析や文書・口コミの分類に使われるほか、データから検証すべき仮説を見つける探索的データ解析にも利用されます。
座学では、クラスターに分ける際の基準となる類似度・距離について説明した後、2種類のクラスター分析(階層・非階層)について、各手法のメリット・デメリットとともに紹介します。
ハンズオンでは、サンプルデータに対するクラスター分析をPythonで実装します。また、生成された各クラスターの特徴・傾向を把握する方法についても解説します。
受講者の想定 |
※Pythonを使用した基本的なデータハンドリングができる方を対象とします。 |
---|---|
受講者が得られる知識・スキル |
|