
Matplotlib 파이썬에서 유명한 시각화 라이브러리데이터 시각화 필요한 모든 기능 갖춘 도구 1. 라이브러리 불러오기1) Matplotlib에서 한글을 쓰기위하여 한글표시 설치 # 한글 표시를 위해 설치!pip install koreanize_matplotlib -q 2) 실습에 필요한 라이브러리 불러오기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport koreanize_matplotlibimport warningswarnings.filterwarnings(action='ignore')%config InlineBackend.figure_format='retina' 2. 기본 차트 그리기 데이터를 읽어오고 전처리하는 ..

수치형 변수란 비교할 수 있는 연속적인 숫자를 갖는 변수!평균, 최댓값, 최솟값, 중앙값 등을 확인해 분석쉽게 이해하려면 데이터의 평균을 낼 수 있냐? 속으로 생각하면 된다. 데이터 불러오기, 전처리는 생략 => 타이타닉 데이터를 불러왔다. ★ 수치형(양적 데이터)을 수치화하려면 Min, Max, Mean, Std, 사분위수 등의 메서드를 사용한다.★ 수치형(양적 데이터)을 시각화하려면 Histogram, Desity Plot, Box Plot, Linear Plot 등의 시각화 도구를 사용한다. 1. 수치화 수치형 변수를 수치화해 분석할 때는 평균, 중앙값, 최빈값, 4분위수 등 대표값을 사용 1) 평균 mean(): 평균titanic['Fare'].mean() 2) 중앙값 median(): 중앙값 ..
데이터 탐색은 데이터 크기와 내용, 분포, 누락된 값을 확인하는 과정이다.데이터가 무언가 부족할 경우 전처리를 해야되는데 이것을 하기위해 데이터를 살펴보는 과정이다! 2.1 앞, 뒤 일부 데이터, 크기 확인 1) 상위 데이터 확인head(n)# 상위 10개 행 데이터tip.head(10) 2) 하위 데이터 확인tail(n)# 하위 3개 행 데이터tip.tail(3) 3) 크기 확인shape(): 데이터 양을 확인하는 목적으로 많이 사용!# 행 수와 열 수 확인tip.shape 2.2 열, 행 정보 보기 1) 인덱스 확인?.index# 인덱스 확인tip.index 2) 값 확인: values 확인# 값 확인tip.values 3) 열확인# 열 확인tip.columns 4) 자료형 확인?.dtypes in..
1.1. 데이터프레임 형태 1) 인덱스와 열 이름이 없는형태 2) 열이름을 지정한 형태 3)인덱스와 열이름을 지정한 형태 1.2. 데이터프레임 만들기 1.2.1. 판다스 불러오기import pandas as pd 1.2.2 리스트로 만들기 1) 1 차원 리스트 만들기# 1차원 리스트 만들기stock = [94500, 92100, 92200, 92300]# 데이터프레임 만들기df = pd.DataFrame(stock)# 확인df.head() 2) 2차원 리스트 만들기# 2차원 리스트 만들기stock = [[94500, 92100, 92200, 92300], [96500, 93200, 95900, 94300], [93400, 91900, 93400, 92100], ..