企業向け研修

クラスター分析入門

講座概要

本講義では、データを類似度に基づいて複数の集団に分割する手法であるクラスター分析について学びます。 クラスター分析は、顧客・商品の分類に利用されることが多く、主にマーケティング領域で活用されています。また、遺伝子配列の解析や文書・口コミの分類に使われるほか、データから検証すべき仮説を見つける探索的データ解析にも利用されます。

座学では、クラスターに分ける際の基準となる類似度・距離について説明した後、2種類のクラスター分析(階層・非階層)について、各手法のメリット・デメリットとともに紹介します。

ハンズオンでは、サンプルデータに対するクラスター分析をPythonで実装します。また、生成された各クラスターの特徴・傾向を把握する方法についても解説します。

受講者の想定
  • 顧客・商品・文書などをデータに基づいて分類したい方
  • 多変量のデータを要約する方法を学びたい方
  • クラスター分析の理論を基礎から学びたい方
  • Pythonでクラスター分析を実装する方法を学びたい方

※Pythonを使用した基本的なデータハンドリングができる方を対象とします。

受講者が得られる知識・スキル
  • 商品を購入した顧客や見込み顧客の分類を行い、施策のターゲットを抽出することができる。
  • 各クラスターの特徴を把握することで、クラスターごとに最適なアプローチ戦略を取ることができる
    例)商品の情報に売上状況を加味した商品の分類を行うことで、販売戦略を見直すことができる