逻辑错误数据的清洗可分为以下两类:
一是去掉重复的数据。在course_info表中存在所有字段内容都相同的情况,此为完全重复。
二是修正矛盾内容。在course_info表中存在“总学时=上机学时+实验学时+讲课学时”的关系,但是实际的数据结果并非如此。比如第238条数据:总学时为40,上机学时、实验学时、讲课学时均为0,显然不符合逻辑;第282条数据:总学时为64,上机学时为0,实验学时为0,讲课学时为40。
用户访问量
注册用户数
在线视频观看人次
在线实验人次
逻辑错误数据的清洗可分为以下两类:
一是去掉重复的数据。在course_info表中存在所有字段内容都相同的情况,此为完全重复。
二是修正矛盾内容。在course_info表中存在“总学时=上机学时+实验学时+讲课学时”的关系,但是实际的数据结果并非如此。比如第238条数据:总学时为40,上机学时、实验学时、讲课学时均为0,显然不符合逻辑;第282条数据:总学时为64,上机学时为0,实验学时为0,讲课学时为40。
¥ 5999
·难
·20
¥ 9999
·难
·1
¥ 7999
·难
·8
¥ 199
·易
·31
¥ 899
·适中
·15
¥ 1688
·适中
·198
¥ 28000
·难
·169
¥ 199
·偏易
·3589
¥ 100000
·难
·171
¥ 998
·难
·9
¥ 1899
·难
·15
¥ 199
·易
·342
¥ 5999
·适中
·30
¥ 6999
·难
·18
¥ 5999
·难
·15
¥ 3999
·难
·15
¥ 2999
·难
·57