본문 바로가기
Python

[python] 문자열 공백 제거 replace 함수 사용하기

by clolee 2021. 10. 5.
str.replace(old, new[, count])

 

다음뉴스 정치탭을 크롤링하여 저장한 bin파일 읽기

dataframe의 head()만 출력해 확인하기

with open(daum_link1, 'rb') as f:
  df_daum_link1 = pickle.load(f)
  
df_daum_link1.head()

 

'Press' column을 통해 언론사의 이름만 확인하기

df_daum_link1["Press"].unique()

 

 

언론사 이름에서 공백 지우기

 

pandas dataframe의 column에 대해서 그냥 replace를 하면 replace가 되지 않은 것을 볼 수 있다.

위와 같이 공백이 제거되지 않는다.

replace 앞에 str을 추가하면 replace함수가 제대로 적용된다.

df_daum_link1["Press"] = df_daum_link1["Press"].str.replace(" ", "")
df_daum_link1["Press"].unique()

언론사 이름 중 공백이 있던 'SBS Biz'가 replace 로 공백을 없애 주니 'SBSBiz'로 변경된 것을 확인할 수 있다.

 

참고 : 

https://docs.python.org/3/library/stdtypes.html?highlight=replace#str.replace

https://stackoverflow.com/questions/28986489/how-to-replace-text-in-a-column-of-a-pandas-dataframe

댓글