聚类分析定义:
聚类分析作为统计学习的一个分支和一种无指导的机器学习方法,已有几十年的研究历史。近年来,随着数据挖掘的兴起,聚类分析成为数据分析领域的一个研究热点。聚类分析不仅是数据挖掘的重要有效方法,同时也是其他挖掘任务的前奏。聚类分析已经成为数据挖掘研究领域一个非常活跃的研究课题。
聚类分析是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析符合人类认知过程,是一种重要的数据挖掘手段,属于无监督学习的范畴。聚类和分类的最大区别在于:聚类不需要标签而分类需要标签,即聚类和分类分别属于无监督和有监督的学习范畴。