R
[R] 하나의 key-id 에 대한 중복 row 제거 (duplicated)
StatZealot
2020. 8. 5. 09:15
하나의 key-id 에 대해 여러 날짜의 중복된 row 가 존재하는 경우
Key-id | Date | Value |
A1 | 2020-02-01 | 12 |
A1 | 2020-01-01 | 23 |
A1 | 2020-03-01 | 11 |
A2 | 2020-03-02 | 22 |
A2 | 2020-02-05 | 15 |
A1, A2 각각 Date가 최신인 row만 남기고 싶다면?
> library(dplyr)
> DT %>% arrange(desc(Date)) %>% filter(!duplicated(Key-id))
※ duplicated 함수는 중복 item 중 처음 등장한 것을 제외하고 모두 TRUE로 반환
→ !duplicated 를 사용하면 중복 중 최초 등장한 것만 남기고 모두 지움