• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

数据清洗,数据去重方法

作者:云创智学|发布时间:2021-12-29 17:26:45.0|来源:云创智学

数据清洗数据去重方法:

数据重复检测函数包括unique、duplicated。

unique对于一个向量管用,对于matrix、data frame那些就不管用了。

duplicated函数是一个可以用来解决向量或者数据框重复值的函数,它会返回一个TRUE和FALSE的向量,以标注该索引所对应的值是否是前面数据所重复的值。

以数据data.set为例,说明解决办法。

 (1)建立是否重复索引

> index<-duplicated(data.set$Ensembl)

> index

 [1] FALSE TRUE FALSE TRUE TRUE TRUE TRUE TRUE TRUE FALSE

> data.set2<-data.set[!index,] #去掉重复行


联系方式
企业微信