返回首页

《数据挖掘》学习笔记

参考资料:《数据挖掘:概念与技术》,第三版,韩家炜。

第一章、引论

数据挖掘功能:特征化与区分,频繁模式、关联和相关性挖掘 ,分类与回归,聚类分析,离群点分析。

类/概念描述:特征化与区分

方法:
(1)数据特征化:一般地汇总所研究类(称为目标类)的数据
(2)数据区分:将一个目标类与一个或多个可比较类(称为对比类)比较
(3)数据特征化与区分
上卷(roll-up)和下钻(drill-down)操作
面向属性的归纳技术

数据特征化

输出形式:饼图、条图、曲线、多维数据立方体和包括交叉表在内的多维表
结果描述:广义关系或特征规则

数据区分

将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。