上海塔罗信息技术有限公司

SAS培训


《聚类技术应用 (CLUS92)》



  
  课程概述:
  
  本课程介绍在当前SAS中可以使用的具有理论基础及实际业务应用的各种聚类技术。这些技术包括聚类前的数据预处理,变量聚类,k-最近邻聚类,k-均值聚类,分层聚类,模糊聚类。
  
  学习目标:
  
  ●为聚类分析进行数据准备和数据探索
  
  ●不同聚类技术的特点及如何选择合适的聚类技术
  
  ●评估聚类分析结果
  
  ●确定合适的聚类数
  
  ●聚类结果特征概述
  
  ●对数据进行分类
  
  课程时间: 2 天
  
  适合学员:
  
  中高级统计人员,数据分析师和数据挖掘人员
  
  课程内容:
  
  1.聚类算法介绍
  
  ●定义聚类类型
  
  ●测量相似度
  
  ●评估多元正态分布
  
  ●使用分类标准
  
  2.聚类前准备
  
  ●为选择变量使用变量聚类
  
  ●使用图形聚类辅助分析
  
  ●使聚类结果更球形化
  
  ●观察标准化自变量对结果的影响
  
  3.等分聚类
  
  ●使用 k-均值聚类
  
  ●概述非参聚类的优点
  
  4.层次聚类
  
  ●使用分层聚类方法
  
  5.评估聚类结果
  
  ●确定聚类数目
  
  ●特征化概述聚类结果
  
  ●对新数据进行聚类评分
  
  6.典型判别分析(CDA)散点图
  
  ●介绍典型判别分析
  
  7.模糊聚类
  
  ●使用FACTOR程序进行模糊聚类
  
  ●基于模糊聚类成员解释PROC FACTOR输出