您的位置:首页 > 其它

R语言筛选出不重复的行的几种方法

2017-07-22 19:13 411 查看

在做项目的过程中遇到筛选不重复的会员信息进行匹配,本次介绍五种筛选不重复行的数据:

五种方法如下:

>>> library(dplyr)
>>> library(sqldf)


方法一:

>>> data1 <- data7_0 %>%
group_by(CELLPHONE,MEMBERID) %>%
filter(row_number() == 1) %>%
ungroup()


方法二:

>>> data2 <- data7_0 %>%
distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)


方法三:

>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")


方法四:

>>> data4 <- base::unique(data7_0)


方法五:

>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ])
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息