R

[R] 하나의 key-id 에 대한 중복 row 제거 (duplicated)

StatZealot 2020. 8. 5. 09:15

하나의 key-id 에 대해 여러 날짜의 중복된 row 가 존재하는 경우

Key-id Date Value
A1 2020-02-01 12
A1 2020-01-01 23
A1 2020-03-01 11
A2 2020-03-02 22
A2 2020-02-05 15

A1, A2 각각 Date가 최신인 row만 남기고 싶다면?

 

> library(dplyr)

> DT %>% arrange(desc(Date)) %>% filter(!duplicated(Key-id))

 

※ duplicated 함수는 중복 item 중 처음 등장한 것을 제외하고 모두 TRUE로 반환

   → !duplicated 를 사용하면 중복 중 최초 등장한 것만 남기고 모두 지움