コレスポンデンス分析とは
コレスポンデンス分析は、2つの変数がどのように関連しているかを可視化するための手法です。主にマーケットリサーチなどで用いられ、クロス集計表を2次元プロットすることで、カテゴリAとカテゴリBの関係性を把握することができます。
コレスポンデンス分析の流れ
- データからクロス集計表を作成する。
- 行方向には変数A、列方向には変数Bのカテゴリを配置する。
- クロス集計表を標準化する。これによって、各カテゴリの出現頻度を均等にすることができます。
- 標準化したクロス集計表を用いて、対応分析を実施する。これによって、カテゴリAとカテゴリBの間の関係性を可視化することができます。
- 対応分析の結果から、カテゴリAとカテゴリBの関係性を把握することができます。また、プロットされたグラフから、カテゴリAとカテゴリBの共起度や排他度なども分かるようになります。
- 対応分析の結果をもとに、カテゴリAとカテゴリBの背後にある要因を分析することもできます。たとえば、ある商品が特定の年代層に受け入れられている理由を分析することができます。
細かな数式の理解にはこちらがおススメです。
コレスポンデンス分析の応用例
対応分析は、マーケットリサーチのほかにも、さまざまな分野で応用されています。以下にその例をいくつか紹介します。
- 自然言語処理においては、単語と文書の関係性を可視化するために利用されます。
- 地理情報システムにおいては、地域と属性の関係性を可視化するために利用されます。
- 化学分野では、化合物と反応物の関係性を可視化するために利用されます。
コレスポンデンス分析の注意点
コレスポンデンス分析は、一般的にクロス集計した後の結果を2次元にプロットする手法です。そのため、クロス集計時にデータを集約しているため、情報がある程度削られているということを意識する必要があります。クロス集計を行う際は、ユーザーごとなどの情報を年代性別毎にまとめることが多いですが、ユーザーの情報をクロス集計せずにコレスポンデンス分析を実施し、各年代性別毎の主成分値を平均等することで、情報を削らずに2次元プロット可能なデータを得ることもできます。
まとめ
コレスポンデンス分析は、2つの変数がどのように関連しているかを可視化するための手法です。マーケットリサーチなどで用いられ、クロス集計表を2次元プロットすることで、カテゴリAとカテゴリBの関係性を把握することができます。対応分析の結果から、カテゴリAとカテゴリBの関係性を把握するだけでなく、背後にある要因を分析することもできます。また、自然言語処理や地理情報システム、化学分野など、さまざまな分野で応用されています。
コレスポンデンス分析は、クロス集計表を用いた手法であるため、データの前処理が重要になります。また、対応分析の結果から得られる情報を正しく解釈するためには、統計的知識や分析技術が必要となります。しかし、その分析結果から得られる情報は、マーケティングや戦略立案などの分野で非常に有用なものとなります。
コレスポンデンス分析におススメの書籍
例題とExcel演習で学ぶ多変量解析 因子分析・コレスポンデンス分析・クラスター分析
こちらの書籍は実際の実践例などを示しながらコレスポンデンス分析などを学んでいくことができます。他にもクラスター分析などかなり有用な手法を学ぶことができるためおススメです。
コメント