一、数据挖掘:
数据挖掘(Data Mining)是从大量的数据中发现有趣知识的过程,涉及统计学、机器学习、模式识别等多个交叉;
主要技术包括分类与预测、聚类、离群点检测、关联规则、序列分析和文本挖掘以及社交网络分析和情感分析等。
二、R语言与数据挖掘有关的任务视图
1、MachineLearning:主要涉及机器学习和统计学习功能
2、Cluster:主要涉及聚类分析和有限混合模型
3、TimeSeries:主要涉及时间序列分析
4、Multivariate:主要用于多元统计分析及其算法
5、Spatial:主要用于空间数据分析
R语言主要用于统计计算和统计制图,提供了大量的统计和制图工具