728x90
Data Manipulation
정의 : 데이터 조작 언어(영어: Data Manipulation Language, DML)은 데이터베이스 사용자 또는 응용 프로그램 소프트웨어가 컴퓨터 데이터베이스에 대해 데이터 검색, 등록, 삭제, 갱신을 위한, 데이터베이스 언어 또는 데이터베이스 언어 요소이다. 2007년 현재 가장 대중적 데이터 조작 언어는 SQL 데이터 조작 언어이다. 출처 : https://ko.wikipedia.org/wiki/데이터_조작_언어
why? : 현실에서는 여러 개로 쪼개진 파일들을 한꺼번에 사용 하는 경우가 더 많습니다.
이러한 경우 결국 하나의 데이터 셋을 만들기 위한 작업이 필요합니다.
핵심 키워드
concat
- 데이터 프레임 붙이는 방법( axis =0/1로 행/열 중 붙이는 기준을 선택 )
merge
- merge는 concat과 다르게 공통된 부분을 기반으로 합치기가 주요 용도
- df.merge("붙일 내용", how = "(방법)", on ="(기준 feature)")
🏆 학습 목표
- pandas를 통해 데이터를
concat
/merge
할 수 있다.
- tidy 데이터 에 대한 개념을 이해한다
melt
와pivot
/pivot_table
함수를 사용하여 wide와 tidy 형태의 데이터를 서로 변환 할 수 있다.
merge 함수
*출처 : https://useful-jang.tistory.com/57
- 공통으로 존재하는 key값에 대하여 자동으로 합쳐지고, 지정할 시 on="열이름"
- how 옵션
: inner(교집합) #default , outer(합집합) , left(차집합(왼쪽)), right(차집합(오른쪽))
merge, concat 참고 자료
tidy data 변환
wide --> tidy
pandas 의 melt
함수
tidy --> wide
pivot_table
함수
네이버 금융 재무제표
용어 정리
매출액 (수익): 영업 활동을 통해 벌어들인 돈
자산 = 자본 + 부채
자본총계 = 자산총계 - 부채총계
자산총계 = 유동자산(현금 등) + 비유동자산(부동산 등)
부채총계 = 단기부채 + 장기부채
네이버를 이용한 재무제표 보는 방법
네이버 지식백과] [Statement of comprehensive income, 包括損益計算書] (두산백과) CAPEX : Capital Expenditures. 자본적 지출이라고도 하며 을 말한다. CAPEX는 기업이 고정자산을 구매하거나, 유효수명이 당회계년도를 초과하는 기존의 고정자산 투자에 돈이 사용될 때 발생한다. 미래의 이윤 창출, 가치의 취득을 위해 지출된 투자 과정에서의 비용 [네이버 지식백과] [Capital Expenditures] (시사경제용어사전, 2017. 11., 기획재정부)


*처음 csv파일을 불러올 때부터 thousands=','를 사용하면 편하다.
728x90
'코드스테이츠 Ai Boostcamp' 카테고리의 다른 글
[통계학] hypothesis-test(가설 검정) (0) | 2021.06.12 |
---|---|
Basic Derivative(미분) (0) | 2021.05.19 |
[Feature Engineering]변수 인덱싱, 결측값 생성 (0) | 2021.05.19 |
EDA (0) | 2021.05.19 |
[Feature Engineering] object로 이루어진 네이버 금융 데이터 변환 (0) | 2021.05.07 |
댓글