数据清洗重要变量选择方法

作者：云创智学|发布时间：2021-12-29 17:28:44.0|来源：云创智学

数据清洗重要变量选择方法：

1、Boruta包

>qsar.data<-read.csv(file=file.choose(),header=T)

>colnames(qsar.data)

>fs.data<-qsar.data[,-1];colnames(fs.data)

>library(Boruta) # 载入Boruta包 ,对重要变量进行选择

>fs.data.extended<-Boruta(activity~.,data=fs.data,

doTrace=2,maxRuns=100,light=TRUE,confidence=1.999)

>print(fs.data.extended)# 查看变量选择结果

>table(fs.data.extended$finalDecision)

>getConfirmedFormula(fs.data.extended) # 查看接收的变量

>getNonRejectedFormula(fs.data.extended) # 查看通过变量选择被接收变量及可供选择的变量

2、subselect包的genetic 函数

>qsar.data<-read.csv(file=file.choose(),header=T)

>dim(qsar.data);colnames(qsar.data)

>library(subselect)

>qsar.dataHmat<-lmHmat(qsar.data[,c(3:23)],qsar.data[,2])

>names(qsar.data[,2,drop=FALSE])

>colnames(qsar.dataHmat)

>genetic(qsar.dataHmat$mat, kmin=2, H=qsar.dataHmat$H, r=1, crit="CCR12")

3、subselect包的anneal 函数

>qsar.data<-read.csv(file=file.choose(),header=T)

>library(subselect)

数据清洗重要变量选择方法

作者：云创智学|发布时间：2021-12-29 17:28:44.0|来源：云创智学

友情链接

关于云创

联系我们

数据清洗 重要变量选择方法

作者：云创智学|发布时间：2021-12-29 17:28:44.0|来源：云创智学

推荐课程

大数据与人工智能就业初级班

大数据与人工智能就业高级班

大数据与人工智能就业中级班

人工智能导论

人工智能图像处理应用

大数据分析挖掘实训课

大数据实战能力提升

ChatGPT应用教学

大数据实战能力提升+金牌服务

云计算职业技能竞赛初级课程（视频资源）

大数据平台技术

大数据应用实训工程实战

云计算职业技能竞赛中级课程（带实验平台实战资源）

云计算职业技能竞赛高级资源增强包

云计算职业技能竞赛中级资源增强包

云计算职业技能竞赛初级资源增强包

云计算职业技能竞赛初级课程/（带实验平台实战资源）

友情链接

关于云创

联系我们

数据清洗重要变量选择方法