数据挖掘需要解决什么问题
数据挖掘需要解决什么问题:1.算法延展性算法延展性即为算法弹性,随着数据产生、采集技术的快速进步,以GB、TB、PB(1GB=1024MB,1TB=1024GB,1PB=1024TB)为单位的数据集越来越普遍。2.高维性在以前的数据库构成中只有少量属性的数据集,现在大数据集群构成中是具有成百上千属性的数据集。3.多种而复杂数据在传统数据分析方法里只处理包含相同类型属性的数据集,或者是连续的,或者是分类的。4.数据的所有权与分布现在经常会有这样的状况,需要分析的数据并非存放在一个站点,或归属一个机构,而是地理或空间分布在属于多个机构的资源中。5.非传统的分析统计方法的传统方法是基于先提出一种假设然后检验,即提出一种假设,再设计实验来收集数据,然后以假设为基础分析数据。
作者:云创智学 来源:云创智学
发布时间:2022-03-09 13:36:53