SAS培训
《聚类技术应用 (CLUS92)》
课程概述:
本课程介绍在当前SAS中可以使用的具有理论基础及实际业务应用的各种聚类技术。这些技术包括聚类前的数据预处理,变量聚类,k-最近邻聚类,k-均值聚类,分层聚类,模糊聚类。
学习目标:
●为聚类分析进行数据准备和数据探索
●不同聚类技术的特点及如何选择合适的聚类技术
●评估聚类分析结果
●确定合适的聚类数
●聚类结果特征概述
●对数据进行分类
课程时间: 2 天
适合学员:
中高级统计人员,数据分析师和数据挖掘人员
课程内容:
1.聚类算法介绍
●定义聚类类型
●测量相似度
●评估多元正态分布
●使用分类标准
2.聚类前准备
●为选择变量使用变量聚类
●使用图形聚类辅助分析
●使聚类结果更球形化
●观察标准化自变量对结果的影响
3.等分聚类
●使用 k-均值聚类
●概述非参聚类的优点
4.层次聚类
●使用分层聚类方法
5.评估聚类结果
●确定聚类数目
●特征化概述聚类结果
●对新数据进行聚类评分
6.典型判别分析(CDA)散点图
●介绍典型判别分析
7.模糊聚类
●使用FACTOR程序进行模糊聚类
●基于模糊聚类成员解释PROC FACTOR输出