数据的概述:
数据挖掘质量的高低与数据有着密切的关系,本节主要探索性学习一些数据相关的知识。
数据类型、数据质量、
数据挖掘前预处理、数据分析
数据集是数据对象的集合。数据对象又叫做点、记录、向量、事件、案例、样本、模式、观测或实体。数据对象用一组刻画对象基本特性(如物体质量或事件发生时间)的属性描述。属性又称为维度、变量、特性、字段、特征等。
1. 属性
(1)区分属性可通过属性可能取值的个数来判断。
(2)非对称的属性
2. 数据集的一般特性
数据集一般具有三个特性,分别是维度、稀疏性、
分辨率三个,它们对数据挖掘有重要影响。
3. 较常见的数据类型