[python] pandas dataframe 중복데이터 찾기, 제거하기 (duplicated / drop_duplicates)
우선 예제로 쓸 데이터프레임을 하나 생성한다. import pandas as pd df = pd.DataFrame({'ID' : ['c_01', 'c_02', 'c_03', 'c_04', 'c_05', 'c_06'], 'Type' : ['a', 'a', 'a', 'b', 'b', 'c'], 'Rank' : [1, 1, 2, 2, 2, 3]}) df DataFrame.duplicated(subset=None, keep='first') 중복 행 확인하기 subset은 중복을 확인할 열을 [리스트 형태]로 입력한다. default는 모든 열에 대해 중복을 확인한다. keep은 first, last, False 중 선택한다. default는 first. keep='first' 이면 중복 행 중 첫번째 행만 Fa..
2021. 10. 21.