Hierarchical Clustering with Simple Matching and Joint Entropy Dissimilarity Measure

A Mete Çilingtürk, Marmara University, Istanbul, TurkeyFollow
Özlem Ergüt, Marmara University, Istanbul, TurkeyFollow

Abstract

Conventional clustering algorithms are restricted for use with data containing ratio or interval scale variables; hence, distances are used. As social studies require merely categorical data, the literature is enriched with more complicated clustering techniques and algorithms of categorical data. These techniques are based on similarity or dissimilarity matrices. The algorithms are using density based or pattern based approaches. A probabilistic nature to similarity structure is proposed. The entropy dissimilarity measure has comparable results with simple matching dissimilarity at hierarchical clustering. It overcomes dimension increase through binarization of the categorical data. This approach is also functional with the clustering methods, where a- priori cluster number information is available.

DOI

10.22237/jmasm/1398918000

Download

Included in

Applied Statistics Commons, Social and Behavioral Sciences Commons, Statistical Theory Commons

COinS

Journal of Modern Applied Statistical Methods

Hierarchical Clustering with Simple Matching and Joint Entropy Dissimilarity Measure

Authors

Abstract

DOI

Included in

Share