jupyter notebook에서 아래 작업들을 실시하였다
import pandas as pd
pd.read 를 입력한 후 tab버튼을 누르면 여러가지 함수 이름이 나오게 됨
pd.read.csv 이후 불러올 파일에 대해서 경로가 어디에 있는지만 알게되면 불러들어올 수 있음.
이보다 더 간단한 방법은 jupyter notebook과 동일한 경로에 동일한 directory안에 해당 csv파일이 있으면
아래와 같이 csv파일명으로만 해도 불러들여올 수 있음
pd.read.csv('company.csv')
-> csv파일에 담겨있는 데이터들을 볼 수 있음
변수설정 company = pd.read.csv('company.csv')
company
type(company)
print(company.shape) -> 출력 : 몇개의 행(row)과 열(column)로 구성되어 있는지 알려줌
해당 데이터 내의 일부분을 확인하고자 할 때(상위 5개, 하위 5개에 대한 data 정보)
company.head() *여기서 company는 변수명이며 괄호() 안에 숫자에 따라 data정보를 확인할 수 있는 개수 지정 가능
company.tail()
column(열)별로 데이터를 확인하고자할 때
company['column명'] 입력하면 series라는 데이터 프레임의 형태로 값이 도출됨
type(company['column명'])
즉, Data Frame은 여러개의 series형태로 구성된 것으로 볼 수 있음
복수개의 column내의 데이터를 확인하고자 할때!!
확인하고자하는 column중에서 list처럼 아래와 같이 설정해준다
예시)
column_names - ['회사명' , '종목코드', '분류']
company[column_names]
또는
company[['회사명', '분류', '종목코드']] -> 다음과 같이 대괄호 두번을 해줘야 하며 리스트 나열식으로 입력한다
위의 나온 Data Frame 기반으로 특정 데이터들을 확인하고자 할 때 아래와 같이 입력 가능
company[['회사명', '분류', '종목코드']].head()
company[['회사명', '분류', '종목코드']].tail()
'데이터 분석' 카테고리의 다른 글
금융데이터 분석을 위한 Pandas 기초공부(3) (0) | 2022.06.09 |
---|---|
금융데이터 분석을 위한 Pandas 기초공부(2) (2) | 2022.06.08 |
파이썬 프로그래밍 기초 공부정리(4) (0) | 2022.06.01 |
파이썬 프로그래밍 기초 공부정리(3) (0) | 2022.05.31 |
파이썬 프로그래밍 기초 공부정리(2) (0) | 2022.05.30 |