데이터분석 8

금융데이터 분석을 위한 파이썬 프로그래밍(1)

데이터형태에는 크게 정수형(int), 실수형(float), 문자형(str)이 있음 1.문자형 데이터 안에서 다양한 특수한 기능들에 대해서 알아보기 (1). upper(), lower(), swapcase() 함수 사옹 예시) 'hello'.upper() -> 출력 : Hello 앞의 문자열을 대문자로 변환 'HELLO'.lower() -> 출력 : hello 앞의 문자열을 소문자로 변환 'Hello'.swapcase() -> 출력 : hELLO 앞의 문자열중 소문자 -> 대문자, 대문자 -> 소문자로 변환 (2). capitalize(), title() 함수 사용 sentence = 'This IS DONGHAN' sentence.capitalize() 출력 : This is donghan 문자열 중 가..

데이터 분석 2022.06.10

금융데이터 분석을 위한 Pandas 기초공부(3)

※DataFrame 생성하기! 일반적으로 csv파일을 불러들여와서 DataFrame을 확인하는데 이번엔 직접 만들어보도록 해보자 import pandas as pd pd.DataFrame() -> Pandas에 있는 DataFrame 메소드를 이용해서 빈 데이터프레임을 만든다 예시1-1) sample_data = [ ['2020-01-01', 10000] ['2020-01-02', 20000] -> 리스트안에 리스트가 들어간 형태로 데이터를 구성함 ['2020-01-03', 30000] ] sample_data pd.DataFrame(sample_data) pd.DataFrame(sample_data, columns['date', 'price']) -> DataFrame안에 column명을 지정해줄 수 ..

데이터 분석 2022.06.09

금융데이터 분석을 위한 Pandas 기초공부(2)

아래의 예시 자료는 모두 company.csv파일을 기반으로 작성된 것!! 1, loc함수를 이용해서 Data Frame을 만들고자 할때(원하는 데이터를 뽑고자 할 때) 설정 : 변수명.loc[시작 인덱스행:끝 인덱스 행] -> 시작행에서부터 끝행까지의 원하는 Data Frame 추출 가능 위의 것도 하나의 Data Frame이기 때문에 변수명.loc[시작행:끝행].head() or tail()로 표현 가능 loc함수를 이용하여 특정 행의 특정 열에 대한 Data Frame을 만들고자 할 때 ids = [1, 2, 4, 1950] company.loc[ids][['종목코드', '회사명', '분류']] 또는 ids = [1, 2, 4, 1950] colums = ['종목코드', '회사명', '분류'] co..

데이터 분석 2022.06.08

금융데이터 분석을 위한 Pandas 기초공부(1)

jupyter notebook에서 아래 작업들을 실시하였다 import pandas as pd pd.read 를 입력한 후 tab버튼을 누르면 여러가지 함수 이름이 나오게 됨 pd.read.csv 이후 불러올 파일에 대해서 경로가 어디에 있는지만 알게되면 불러들어올 수 있음. 이보다 더 간단한 방법은 jupyter notebook과 동일한 경로에 동일한 directory안에 해당 csv파일이 있으면 아래와 같이 csv파일명으로만 해도 불러들여올 수 있음 pd.read.csv('company.csv') -> csv파일에 담겨있는 데이터들을 볼 수 있음 변수설정 company = pd.read.csv('company.csv') company type(company) print(company.shape) ->..

데이터 분석 2022.06.06

파이썬 프로그래밍 기초 공부정리(4)

1. 파이썬 딕셔너리 - 유사한 정보들을 그룹화하여 저장/관리 기능 - 각각의 데이터가 key/value 형태로 저장되어 있어서 어떤 종류의 데이터인지 파악 가능 - 딕셔너리는 key와 value값을 저장하고, key값을 기반으로 value를 가져오는 자료구조 **문자열, 리시트는 인덱스를 활용, 딕셔너리는 key값을 활용 **딕셔너리변수명{"key"} - 딕셔너리는 중괄호 '{}'를 이용하여 생성 (리스트의 경우 대괄호'[]'를 사용!!!) - 표기법 : {key1: value1, key: value2} - course_dict={} -> 빈 딕셔너리를 생성 - 중복된 key값들이 있을 땐, 마지막 value값을 가져옴 2. 딕셔너리 관련 함수 1-1)딕셔너리 전체 key값 가져오기-keys() 함수 ..

데이터 분석 2022.06.01

파이썬 프로그래밍 기초 공부정리(3)

1. 반복문 : 일반적으로 for, while문을 사용함 1) while문 예시) 2의 거듭제곱을 반복하여, 결과가 1000이 넘을 때까지 반복 result=1 while result 출력 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024 2) for문 (일반적으로 for문을 많이씀) - 문자열, 리스트, 튜플... - sequence 데이터에서 item을 인덱스 순서대로 반복적으로 가져욤 - range()함수와 함께 사용하면 주어진 횟수만큼 반복 가능 예시) 정수 값이 저장되어 있는 리스트가 주어졌을 대, 각각의 값에 100을 곱한 결과를 저장하는 새로운 리스트를 생성 - [1,2,3,4,5,6,7,8,9,10] -> [100,200,300,400,500,600,700,800,9..

데이터 분석 2022.05.31

파이썬 프로그래밍 기초 공부정리(2)

1. Boolean 자료형 - true_value=True - false_value=False *T, F는 반드시 대문자로 입력해야함 2. 비교연산자 == 값이 같은가? != 값이 다른가? > 값이 큰가? = 값이 크거나 같은가? 출력 AI is in the list. 3)파이썬 조건문 - if-elif-else 구문 예시) if condition1: do something1 elif condition2: do something2 else: do something3 예시) score = 85 if score >= 90: print("A") elif socre >= 80: print("B") else: print("F") 3)파이썬 조건문 - if-다중elif-else 구문 예시) if..

데이터 분석 2022.05.30

파이썬 프로그래밍 기초 공부정리(1)

주석 : 코드에 부가적인 정보를 추가하는 목적으로 사용하고 파이썬 인터프리터에 의해 무시되며 실행되지 않음. -> 코드 내용을 이해할 수 있도록 잘 사용할 경우 가독성을 높임 1)단일행 주석 : # 사용 2)다중행 주식 : 시작 시 ''' 쓰고 끝날 씨 '''로 마무리 하면됨 #파이썬에서 자주 활용되는 자료형(Data type)의 종류 1. int(정수 자료형) 2. float(실수 자료형) 3. str(문자 자료형) 4. bool(True, False를 나타내는 Boolean 자료형) 5. list(연속된 데이터의 집합을 나타내는 리스트 자료형) 6. tuple(연속된 데이터의 집합을 나타내는 튜플 자료형) 7. dict(Key, Value 형태의 데이터 집합을 나타내는 딕셔너리 자료형) #자료형 ty..

데이터 분석 2022.05.30