
1. 텐서 다루기 torch 라이브러리 불러오기import torchimport numpy as npimport pandas as pd 1) 텐서 만들기torch.tensor(): 데이터 프레임은 제공되지않는다. 오류남# 리스트data = [[1, 2],[3, 4],[5, 6]]x_data = torch.tensor(data)x_data # 넘파이 어레이np_array = np.array(data)x_np = torch.tensor(np_array)x_np 2) 텐서의 속성 np.shape: 텐서의 형태np.dtype: 텐서의 타입np.device: 텐서의 디바이스print(x_np)print(f"Shape : {x_np.shape}")print(f"Datatype : {x_np.dtype}")print..

★ 딥러닝 모델링 준비 순서: 환경준비 => 필요한 함수 만들기 => 데이터 전처리 및 분할 => 스케일링 => 딥러닝 모델링이다.★ 딥러닝 모델링 시작 순서: 딥러닝을 위한 데이터 준비 => 모델 선언 => 목적함수(손실함수), 옵티마이저 선언 => 모델학습 => 모델 평가이다. 1. 딥러닝 모델링 준비 1) 환경 준비metrics, train_test_split, Scaler 그리고Pytorch, nn, Adam 등의 필요한 라이브러리를 Import 해준다.import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.model_selection import train_test_s..

★ 수치형 -> 범주형 시각화: Histogram, Density plot (x와 hue로 줘야됨! y로 주면 이상한 그래프 나옴)★ 수치형 -> 범주형 수치화: 로지스틱 회귀모델(p-value) 1. 시각화 - Seaborn 사용 1) histplot()Age(수치형) -> Survived(범주형)hue를 사용해야된다.sns.histplot(x='Age', hue='Survived', data=titanic, bins=20)plt.show() Fare(수치형) -> Survived(범주형)sns.histplot(x='Fare', hue='Survived', bins=20, data=titanic)plt.show() 2) Density Plot - Seaborn 사용kdeplot() Age(수치형) -..

★ 범주형 vs 범주형- 교차표: crosstab()- 시각화: 100% stacked Bar, Mosaic Plot- 수치화: 카이제곱 검정 1. 교차표 범주형 vs 범주형을 비교하기 위해서는 교차표를 먼저 만들어야된다. - Pandas 사용crosstab() Sex(범주형) -> Survived(범주형) 교차표pd.crosstab(titanic['Sex'], titanic['Survived']) Embarked(범주형) -> Survived(범주형) 교차표pd.crosstab(titanic['Embarked'], titanic['Survived']) ※ 교차표의 속성값(normalize)'index': 각 행의 상대적인 비율(각 행의 합이 1)'columns': 각 열의 상대적인 비율(각 열의 합..

범주형 -> 수치형 그래프를 나타내려면 어떤 도구를 사용할까?★ 범주형 -> 수치형 시각화 도구 barplot(), boxplot() 데이터 불러오기 전처리 과정은 타이타닉으로 했다. 1. 시각화 - Seaborn 사용1) barplot(): 범주값의 평균을 비교 할 수 있다.sns.barplot(x='Survived', y='Age', data=titanic)plt.show() 생존자와 사망자 각각의 나이 평균을 볼 수 있는 것사망자: 31세생존자: 28세 2) boxplot(): 범주값 간의 값 분포를 비교sns.boxplot(x='Survived', y='Age', data=titanic)plt.show() 생존자 사망자 각각의 평균, 중앙값, 사분위수, 이상치 판단을 할 수 있다. 생존자 중..

상관 분석은 수치형 변수 x에 대한 수치형 변수 y의 관계를 분석할 때 사용상관 분석은 산점도를 사용해 시각화 두 수치형 변수 x와 y가 어떤 관계를 보이는지, 얼마나 강한 관계인지 판단하는데 중요한 관점이 직선이다. ★ 수치형 vs 수치형 시각화는 산점도(Scatter Plot, Pair Plot, Joint Plot) 사용★ 수치형 vs 수치형 수치화는 상관계수(상관 있냐/없냐?), p-value(이 대립가설 신뢰 할 만해?) 사용★ 귀무가설 vs 대립가설 개념 1. 시각화 1) 산점도산점도는 두 변수간의 관계를 나타내는 그래프 - Matplotlib 사용 scatter() plt.scatter(x='Temp', y='Ozone', data=air)plt.xlabel('Temp')plt.ylabel(..