데이터 분석

금융데이터 분석을 위한 Pandas 기초공부(1)

남참새 2022. 6. 6. 23:31
728x90
반응형

jupyter notebook에서 아래 작업들을 실시하였다

import pandas as pd

pd.read 를 입력한 후 tab버튼을 누르면 여러가지 함수 이름이 나오게 됨

pd.read.csv 이후 불러올 파일에 대해서 경로가 어디에 있는지만 알게되면 불러들어올 수 있음.

이보다 더 간단한 방법은 jupyter notebook과 동일한 경로에 동일한 directory안에 해당 csv파일이 있으면

아래와 같이 csv파일명으로만 해도 불러들여올 수 있음

pd.read.csv('company.csv')

-> csv파일에 담겨있는 데이터들을 볼 수 있음

변수설정 company = pd.read.csv('company.csv')

company

type(company)

print(company.shape) -> 출력 : 몇개의 행(row)과 열(column)로 구성되어 있는지 알려줌

해당 데이터 내의 일부분을 확인하고자 할 때(상위 5개, 하위 5개에 대한 data 정보)

company.head() *여기서 company는 변수명이며 괄호() 안에 숫자에 따라 data정보를 확인할 수 있는 개수 지정 가능

company.tail()

column(열)별로 데이터를 확인하고자할 때

company['column명'] 입력하면 series라는 데이터 프레임의 형태로 값이 도출됨

type(company['column명'])

즉, Data Frame은 여러개의 series형태로 구성된 것으로 볼 수 있음

복수개의 column내의 데이터를 확인하고자 할때!!

확인하고자하는 column중에서 list처럼 아래와 같이 설정해준다

예시)

column_names - ['회사명' , '종목코드', '분류']

company[column_names]

또는

company[['회사명', '분류', '종목코드']]  -> 다음과 같이 대괄호 두번을 해줘야 하며 리스트 나열식으로 입력한다

위의 나온 Data Frame  기반으로 특정 데이터들을 확인하고자 할 때 아래와 같이 입력 가능

company[['회사명', '분류', '종목코드']].head()

company[['회사명', '분류', '종목코드']].tail()