数据清洗任务
1、数据清洗就是对原始数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并使得数据保持精确性、完整性、一致性、有效性及唯一性,还可能涉及数据的分解和重组,最终将原始数据转换为满足数据质量或应用要求的数据。2、数据清洗对保持数据的一致和更新起着重要的作用,因此被用于如银行、保险、零售、电信和交通的多个行业。数据清洗主要有三个应用领域:数据仓库(DataWarehouse,DW)、数据库中知识的发现(KnowledgeDiscoveryinDatabase,KDD)和数据质量管理(DataQualityManagement,DQM)。3、数据清洗对随后的数据分析非常重要,因为它能提高数据分析的准确性。但是数据清洗依赖复杂的关系模型,会带来额外的计算和延迟开销,必须在数据清洗模型的复杂性和分析结果的准确性之间进行平衡。
作者:云创智学 来源:云创智学
发布时间:2022-05-09 13:31:57