728x90
재무제표 데이터
위와 같은 네이버 금융의 재무재표 데이터를 다운받아 파이썬으로 불러오면 숫자형이 아니라, 콤마가 있는 문자열로 인식하는 문제가 발생한다.
이럴 경우 문자열을 다루는 함수인 replace 함수와 컬럼에 함수를 전체 적용하는 apply함수를 사용하여 컬럼을 숫자형으로 변환한다.
object -> int 변환하기
매출액과 영업이익 피쳐에 있는 ','를 ''로 대체하여 삭제하고 int형으로 변환하기 위해
이를 문자열에 적용하는 toInt함수를 정의하고 이를 apply함수로 두 피쳐(매출액과 영업이익)에 적용하였다.
이후 object였던 두 피쳐가 int형으로 변환된 것을 확인할 수 있다.
여러 변수 변환하기 적용하기
object인 변수 확인
변수들 중 object인 변수를 확인하고 이들의 인덱스 위치를 확인한다.
이후 for문으로 모든 object 변수를 한번에 int형으로 변환한다.
이제 분기를 제외한 모든 변수가 정수형 혹은 실수형으로 변환된 것을 확인할 수 있다.
728x90
'코드스테이츠 Ai Boostcamp' 카테고리의 다른 글
Basic Derivative(미분) (0) | 2021.05.19 |
---|---|
Data Manipulation (0) | 2021.05.19 |
[Feature Engineering]변수 인덱싱, 결측값 생성 (0) | 2021.05.19 |
EDA (0) | 2021.05.19 |
[Feature Engineering] 형 변환 (0) | 2021.05.07 |
댓글