数据挖掘常用算法有哪几类:
大数据挖掘常用的算法有分类、聚类、回归分析、关联规则、特征分析、Web页挖掘、神经网络等智能算法。
1、分类
分类就是通过学习得到一个目标函数,根据目标数据的不同特点按照分类模式将其划分为不同的类别,其作用是通过分类模型,将目标数据映射到某个特定的类别。
2、聚类
聚类分析是把一组数据按照差异性和相似性分为几个类别,使得属于同一类的数据之间相似性尽可能大,不同类之间的相似性尽可能小,跨类的数据关联性尽可能低。
3、回归分析
回归分析是确定两种或两种以上变量相互之间依赖性关系的一种统计分析方法,用以分析数据的内在规律,常用于数值预报、系统控制等问题。
4、关联分析
关联分析最主要的目的就是找出隐藏在数据之间的相互关系和关联性,即可以根据一个数据项的出现推导出其他相关数据项的出现。
5、特征分析
特征分析是指从数据库中的一组数据中提取出关于这些数据的特征式,这些特征式即为此数据集的总体特征。
6、Web网页挖掘
Web网页挖掘涉及Web技术、计算机语言、信息学等多个领域,是一个综合性过程。
7、人工神经网络
人工神经网络是一种模拟大脑神经突触联接结构来进行信息处理的数学模型,具有强大的自主学习能力和联想存储功能并具有高度容错性,非常适合处理非线性数据以及具有模糊性、不完整性、冗余性特征的数据。