본문 바로가기

인공지능/캐글

(3)
1-3. Titanic Top 4% with ensemble 앞의 내용과 마찬가지로, 1-1, 1-2에서 진행했던 EDA부분은 생략하겠다.(null값, describe, feature 그래프..) https://ekdud7667.tistory.com/44 https://ekdud7667.tistory.com/42 데이터 그래프 부분은 위쪽을 참고를 부탁드린다. 1. Load Data & check Outlier detection featur를 반복하며 outlier를 넘는 데이터 출력 후 drop 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 train = pd.read_csv('trai..
1-2. EDA To Prediction https://ekdud7667.tistory.com/42?category=897373 1-1. 타이타닉 튜토리얼1 import & data 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) # 이.. ekdud7667.tistory.com 1.2부터는 튜토리얼과 EDA가 겹치는 부분이 많아, 겹치는 부분은 설명 없이 진행하려 합니다. EDA의 자세한 설명은 튜토리얼 링크에서 참고하세요. 1. EDA 1 2 3 4 5 6 7 8 9 10 1..
1-1. 타이타닉 튜토리얼1 import & data 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) # 이 두줄은 본 필자가 항상 쓰는 방법입니다. matplotlib 의 기본 scheme 말고 seaborn scheme 을 세팅하고, 일일이 graph 의 font size 를 지정할 필요 없이 seaborn 의 font_scale 을 사용하면 편합니다. import missingno as msno import warnings warnings.filterwarnin..