目前常用的几种基于划分的聚类方法主要处理数值型数据,能有效处理实际应用领域中常用的包括数值和符号混合数据的聚类算法则较少。基于此问题,文章根据k均值、k中心点和k众数等基于划分的聚类方法各自的特点,对其进行集成与改进,提出一种能够应用于混合类型数据的聚类分析方法,即将所有的混合类型变量转换到共同的标度区间[0.0,1.0]中,根据合并处理的相异度计算公式计算对象之间的相异度;对于聚类中心中的各变量采取适合于相应类型的最佳方法进行独立更新,从而实现混合类型变更量数据的有效聚类。 更多还原
【Abstract】 The usual clustering methods based on partitioning mainly process numerical data and it is lack of the clustering method that can deal with hybrid category data. Because of these problems, this paper integrates and improves the traditional and classical clustering methods those are k-means, k-medoids and k-modes in order to propose a method that can solve the cluster analysis about hybrid category data according to those traditional methods’ characteristics. This paper’s method converts all hybr... 更多还原