数据归约的3种方法:
数据归约可以分为三类,分别是特征归约、样本归约、特征值归约。
1、特征归约是将不重要的或不相关的特征从原有特征中删除,或者通过对特征进行重组和比较来减少个数。其原则是在保留、甚至提高原有判断能力的同时减少特征向量的维度。特征归约算法的输入是一组特征,输出是它的一个子集。
2、样本归约就是从数据集中选出一个有代表性的子集作为样本。子集大小的确定要考虑计算成本、存储要求、估计量的精度以及其它一些与算法和数据特性有关的因素。
3、特征值归约分为有参和无参两种。有参方法是使用一个模型来评估数据,只需存放参数,而不需要存放实际数据,包含回归和对数线性模型两种。无参方法的特征值归约有3种包括直方图、聚类和选样。