본문 바로가기
코드스테이츠 Ai Boostcamp

[Feature Engineering] object로 이루어진 네이버 금융 데이터 변환

by mintee
728x90

재무제표 데이터

네이버금융에서 조회한 kt&g 재무제표 데이터 - https://finance.naver.com/item/coinfo.nhn?code=033780&target=finsum_more

위와 같은 네이버 금융의 재무재표 데이터를 다운받아 파이썬으로 불러오면 숫자형이 아니라, 콤마가 있는 문자열로 인식하는 문제가 발생한다.

파이썬으로 불러온 네이버 kt&g의 재무제표 데이터

이럴 경우 문자열을 다루는 함수인 replace 함수와 컬럼에 함수를 전체 적용하는 apply함수를 사용하여 컬럼을 숫자형으로 변환한다.

object -> int 변환하기

매출액과 영업이익 피쳐에 있는 ','를 ''로 대체하여 삭제하고 int형으로 변환하기 위해

이를 문자열에 적용하는 toInt함수를 정의하고 이를 apply함수로 두 피쳐(매출액과 영업이익)에 적용하였다.

이후 object였던 두 피쳐가 int형으로 변환된 것을 확인할 수 있다.

 

여러 변수 변환하기 적용하기

object인 변수 확인

변수들 중 object인 변수를 확인하고 이들의 인덱스 위치를 확인한다.

이후 for문으로 모든 object 변수를 한번에 int형으로 변환한다.

이제 분기를 제외한 모든 변수가 정수형 혹은 실수형으로 변환된 것을 확인할 수 있다.

728x90

'코드스테이츠 Ai Boostcamp' 카테고리의 다른 글

Basic Derivative(미분)  (0) 2021.05.19
Data Manipulation  (0) 2021.05.19
[Feature Engineering]변수 인덱싱, 결측값 생성  (0) 2021.05.19
EDA  (0) 2021.05.19
[Feature Engineering] 형 변환  (0) 2021.05.07

댓글