机器学习特征选择概念:
根据所特征选择是在原有的特征基础上筛选出重要的特征,以达到降低特征维度的目的。数据特征维度可能成千上万,这会造成维度灾难,过多的特征可能会造成计算缓慢,就需要找出冗余特征、贡献度低的特征,把这些特征剔除掉。
机器学习特征选择的三种方法:
1、Filter过滤法
特征重要度排序,相关系数等,主要方法:卡方、方差、相关系数等。
2、Wrapper包装法
搜索优化、特征组合比较,如RFE算法。
3、Embedded嵌入法
学习模型的过程中,挑选出那些对模型训练有重要性的特征。
特征和模型是分不开的,选择的特征不同训练的模型也是不同的。