
범주형은 분류개념이다.타이타닉 데이터에 Pclass는 1, 2, 3 이렇게 주어지는데, Pclass는 1>2>3 이런 순서의 개념을 가지고 있는 것이 아니고 분류의 개념을 가지고 있기때문에 범주형인 것이다. ★ 범주형(질적 데이터)을 수치화하려면 범주별 빈도수, 비율 등을 통해 할 수 있다.★ 범주형(질적 데이터)을 시각화하려면 Bar Plot, Count Plot, Pie Chart 등의 시각화 도구를 사용한다. 데이터는 타이타닉 파일로 진행된다. 1. 수치화 범주형 변수는 범주별 빈도수와 비율을 기초통계량을 통해 확인한다. Pclass 별로 1등석은 몇 명이 탑승했는지, 2등석은 몇 명이 탑승했는지 등을 알 수 있다.비율로 나타내고 싶으면 normalize=True로 설정한다.print(titani..

Seaborn은 Matplotlib 기반으로 작성된 고수준 인터페이스 시각화 도구Matplotlib보다 훨씬 다양한 스타일 테마를 지원Matplotlib 보다 좋다는 말은 아니다! 데이터 읽어오기, 전처리 과정 생략~ 타이타닉 데이터 실습이다. 1. 기본 그래프 1) Histogram histplot(): 단일 변수의 데이터 분포를 히스토그램으로 표시 => 빈도수 표시로 이해 Age 열의 분포를 확인 => 20대는 몇명?, 30대는 몇명?, 70대는 몇명?sns.histplot(x='Age', data=titanic, bins=16, ec='k')plt.show() Age 열 분포에 Survived라는 열을 hue로 설정해주면 나이 별로 생존자를 표시해준다.sns.histplot(x='Age', hue=..

Matplotlib 파이썬에서 유명한 시각화 라이브러리데이터 시각화 필요한 모든 기능 갖춘 도구 1. 라이브러리 불러오기1) Matplotlib에서 한글을 쓰기위하여 한글표시 설치 # 한글 표시를 위해 설치!pip install koreanize_matplotlib -q 2) 실습에 필요한 라이브러리 불러오기import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport koreanize_matplotlibimport warningswarnings.filterwarnings(action='ignore')%config InlineBackend.figure_format='retina' 2. 기본 차트 그리기 데이터를 읽어오고 전처리하는 ..