본문 바로가기
728x90

Python/Data Analysis3

데이터 시각화_matplotlib(1) - plt 기본 설정 데이터 시각화를 위해서 가장 많이 사용되는 파이썬 라이브러리는 'matplotlib' 이다. 다음 과 같은 시각화를 할 수 있다. 1. matplotlib 기본 설정 보통 numpy, pandas 데이터를 시각화 하는데 사용이 되니 기본적으로 numpy, pandas는 불러와주도록 하자 import numpy as np import pandas as pd #graph library import seaborn as sns import matplotlib.pyplot as plt #ignore warning import warnings warnings.filterwarnings('ignore') 2. matplotlib.pylot 여러 옵션 matplotlib.pyplot 모듈은 matlab과 비슷하게 명령.. 2023. 5. 21.
Pandas(DataFrame) 1. pandas 불러오기 import pandas as pd 2. pd.read_csv("data.csv") df_ins = pd.read_csv("insurance.csv") print(df_ins.shape) #data size df_ins.head(10)#top 10 data print(default = 5) 3. dataframe column indexing #dataframe column df_ins.columns #column select(1-column) df_ins['age'] #column select(multi-column) df_ins[['age', 'smoker','charges']] 연습1) PulseRates.csv data import pandas as pd df_pr = p.. 2023. 5. 16.
Numpy Numpy(Numerical Python) : - C/ C++/ 포트란 등의 언어와 통합 가능 - 고성능 수치계산에 특화된 라이브러리 - 벡터 및 행렬 연산에 있어서 굉장히 편리한 기능을 제공 - pandas 와 matplotlib 의 기반이 되는 data handling 모듈 - 리스트에 비해 빠르고 메모리 효율적 - 반복문 없이 데이터 배열에 대한 처리를 지원 - 선형대수와 관련된 다양한 기능 제공 *파이썬은 interpreter 언어이기 때문에 처리 속도에 문제가 있는데 이를 보완할 수 있는 모듈 1. numpy 불러오기 import numpy as np 보통은 numpy 를 np 라는 명칭(alias) 으로 불러옴 2. np.array : 배열을 행렬로 #np.array x = [1,2,3,4] .. 2023. 5. 14.