聚类算法(Cluster Algorithm)
数据预处理--变量筛选,应分析各个变量之间是否具有线性关系,如果两个变量线性相关(可通过相关系数判断),在聚类过程中,这两个变量会因为双重影响而造成距离偏颇,最终影响聚类的结果。如出现这种情况,可以通过有这两个变量衍生出一个新变量来解决。
本文共 216 字,大约阅读时间需要 1 分钟。
聚类算法(Cluster Algorithm)
数据预处理--变量筛选,应分析各个变量之间是否具有线性关系,如果两个变量线性相关(可通过相关系数判断),在聚类过程中,这两个变量会因为双重影响而造成距离偏颇,最终影响聚类的结果。如出现这种情况,可以通过有这两个变量衍生出一个新变量来解决。
转载于:https://www.cnblogs.com/Graduatedben/archive/2013/03/14/2959361.html