数据的质量:
1. 什么是测量误差和数据收集误差
测量误差是测量中测量结果与实际值之间的差值叫误差。
数据收集误差是指收集数据时遗漏数据对象或属性值,或包含了其他数据对象等情况。
2. 什么是噪声
噪声是从物理角度而言,噪声是波形不规则的声音。
3. 什么是精度和准确率
精度(同一个基本量)重复测量值之间的近似程度,一般用值集合的标准差度量。
准确率从实验角度是指在一定实验条件下的多个测定值中,满足限定条件的测定值所占的比例,常用符合率来表示。
4. 遗漏
删除数据对象或属性
估计遗漏值
5. 离群点
离群点又称歧义值或异常值,离群点从数理统计角度是指一个时间序列中,远离序列的一般水平的极端大值和极端小值。
6. 重复数据
时效性
相关性