분류(3)
-
[3] 로지스틱 회귀분석 원리
로지스틱 회귀분석은 시그모이드 함수를 활성화 함수로, 로그 가능도 함수를 비용함수로 사용한다. 활성화함수 오즈비(odds ratio) : 특정 이벤트가 발생할 확률 $$\frac{P}{(1 - P)}$$ 여기서 P는 양성 샘플일 확률로, 예측하려는 대상이 발생할 확률을 가리킨다. 보통 오즈비에 로그 함수를 취해 로짓 함수를 정의한다. $$ logit(P) = log \frac{P}{(1 - P)} $$ 특성의 가중치 합과 로그 오즈 사이의 선형관계는 다음과 같이 표현이 가능하다. $$ logit(P(y=1 \mid x)) = W_0X_0 + W_1X_1 + W_2X_2 + \cdots + W_mX_m = W^T X$$ * (P(y=1|x)은 x의 상황이 주어졌을 때의 1이 될 조건부확률임. 해당 알고리즘..
2020.12.31 -
캐글 타이타닉 1-2. Titanic Survival Prediction(타이타닉 생존자 예측), EDA Features
Kaggle에 올린 첫 노트북입니다. 전반적인 데이터 분석의 흐름을 알기 위해서 모델의 정확성보단 배운 내용을 활용하는 것에 초점을 맞췄습니다. 링크 : www.kaggle.com/choihanbin/titanic-survival-prediction-eda-ensemble 1.2 EDA Features 1.2.1 Sex with Survived feature # Count plots a feature's number without Survival and feature's number with Survival def count_subplots(data, feature1, hue = 'Survived', ylim = None, xlim = None): f, ax = plt.subplots(2, figsize..
2020.12.28 -
캐글 타이타닉 1-1. Titanic Survival Prediction(타이타닉 생존자 예측), Checking Features
Kaggle에 올린 첫 노트북입니다. 전반적인 데이터 분석의 흐름을 알기 위해서 모델의 정확성보단 배운 내용을 활용하는 것에 초점을 맞췄습니다. 링크 : www.kaggle.com/choihanbin/titanic-survival-prediction-eda-ensemble Titanic Survival Prediction(EDA, Ensemble) Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster www.kaggle.com This notebook have Three steps for solve this problem(predict to sur..
2020.12.20