str.replace(old, new[, count])
다음뉴스 정치탭을 크롤링하여 저장한 bin파일 읽기
dataframe의 head()만 출력해 확인하기
with open(daum_link1, 'rb') as f:
df_daum_link1 = pickle.load(f)
df_daum_link1.head()
'Press' column을 통해 언론사의 이름만 확인하기
df_daum_link1["Press"].unique()
언론사 이름에서 공백 지우기
pandas dataframe의 column에 대해서 그냥 replace를 하면 replace가 되지 않은 것을 볼 수 있다.
위와 같이 공백이 제거되지 않는다.
replace 앞에 str을 추가하면 replace함수가 제대로 적용된다.
df_daum_link1["Press"] = df_daum_link1["Press"].str.replace(" ", "")
df_daum_link1["Press"].unique()
언론사 이름 중 공백이 있던 'SBS Biz'가 replace 로 공백을 없애 주니 'SBSBiz'로 변경된 것을 확인할 수 있다.
참고 :
https://docs.python.org/3/library/stdtypes.html?highlight=replace#str.replace
https://stackoverflow.com/questions/28986489/how-to-replace-text-in-a-column-of-a-pandas-dataframe
'Python' 카테고리의 다른 글
[python] 여러개의 데이터프레임 합치기 (concat multiple dataframes in Python) (1) | 2021.10.07 |
---|---|
[python] dictionary list에서 key에 따른 value들 더하기 (0) | 2021.10.06 |
[python] 다음 뉴스 크롤링 (python crawling) (0) | 2021.09.12 |
[python] 파이썬 딕셔너리 안에서 특정 키만 가져오기 (0) | 2021.09.12 |
[python] random 모듈 함수 (0) | 2021.09.06 |
댓글