R语言分类与预测算法有哪些:
1、分类与预测算法—K-近邻算法:
如果一个样本与特征空间中的K个最相似(特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。
2、分类与预测算法—决策树
决策树(Decision Tree)是一种依托于分类、训练上的预测树,根据已知预测、归类未来。
3、分类与预测算法—支持向量机:
支持向量机(Support Vector Machine,SVM)是一个二分类的办法,即将数据集中的数据分为两类。
4、聚类算法及其R包
“聚类”是根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组(或称为簇),并对每个簇进行描述的过程。
常用的聚类算法主要包括K-means聚类、层次聚类和基于密度的聚类
5、聚类算法及其R包—K-means聚类
同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小
6、聚类算法及其R包—层次聚类
一层一层地进行聚类,可以从下而上地把小的cluster合并聚集,也可以从上而下地将大的cluster进行分割。
7、聚类算法及其R包—基于密度的聚类
8、离群点检测与R包
9、关联规则与R包
10、时间序列分类与R包
11、文本挖掘
提取文本中的词语,并统计频率