0
用户访问量
0
注册用户数
0
在线视频观看人次
0
在线实验人次

数据清洗，数据去重方法

作者：云创智学|发布时间：2021-12-29 17:26:45.0|来源：云创智学

数据清洗数据去重方法：

数据重复检测函数包括unique、duplicated。

unique对于一个向量管用，对于matrix、data frame那些就不管用了。

duplicated函数是一个可以用来解决向量或者数据框重复值的函数，它会返回一个TRUE和FALSE的向量，以标注该索引所对应的值是否是前面数据所重复的值。

以数据data.set为例，说明解决办法。

(1)建立是否重复索引

> index<-duplicated(data.set$Ensembl)

> index

[1] FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE

> data.set2<-data.set[!index,] #去掉重复行

友情链接