본문 바로가기

전체 글

(67)
1-1. 타이타닉 튜토리얼1 import & data 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns plt.style.use('seaborn') sns.set(font_scale=2.5) # 이 두줄은 본 필자가 항상 쓰는 방법입니다. matplotlib 의 기본 scheme 말고 seaborn scheme 을 세팅하고, 일일이 graph 의 font size 를 지정할 필요 없이 seaborn 의 font_scale 을 사용하면 편합니다. import missingno as msno import warnings warnings.filterwarnin..
최대우도추정 [https://ratsgo.github.io/statistics/2017/09/23/MLE/](https://ratsgo.github.io/statistics/2017/09/23/MLE/) [https://datascienceschool.net/view-notebook/dc6528fbf3ed4f9885e243198ef7694c/] 최대우도추정 최대우도추정(maximum likelihood estimation)이란 모수(parameter)가 미지의 θ인 확률분포에서 뽑은 표본(관측치) x들을 바탕으로 θ를 추정하는 기법입니다. 다시말해, 표본들을 보고 모수를 추정하는 것이다. 동전 던지기를 예를 들어보자. 동전 던지기는 이항분포를 따르며, 앞면이 나올 확률 p와 뒷면이 나올 확률 1-p로 이뤄진다. 이항..
Collaborative Filtering for Implicit Feedback Datasets implicit한 feedback을 추가해서 추천시스템을 만들 수 있다. * purchase history, browsing history, search patterns, mouse movements.. implicit feedbak의 특징 1. negative 한 feedback이 없다. implicit feedback을 보고 user가 좋아하는지, 좋아하지 않는지 알 수 없다. 유저가 어떤 영화를 봤지만 싫어할 수 있기 때문이다. missing data의 경우 부정적인 피드백일 가능성이 높기 때문에 missing data에 대해서 어떻게 처리를 할지 고려해야 한다.(missing data= no action) 2. 근본적으로 nosiy가 많다. 예를 들어, 한 아이템을 구매했지만 선물용으로 구매했을 ..
3-1. 고급 선형대수: 선형대수와 해석기학의 기초 팀블로그인 데이터맛집에서 참고했습니다. https://data-matzip.tistory.com/manage/newpost/11?type=post&returnURL=https%3A%2F%2Fdata-matzip.tistory.com%2F11%3Fcategory%3D850503 TISTORY 나를 표현하는 블로그를 만들어보세요. www.tistory.com 정규직교 만약 N개의 단위벡터 ν₁, ν₂, ... νn 이 서로 직교하면 정규직교 라고 한다. 특징 직교하는 벡터들은 선형 독립이다 * 선형 독립의 직교성 증명 linearly independent한 non zero $v_1, v_2,...,v_n$이 있을 때 $c_1 v_1 + ... + c_n v_n= 0$을 만족하기 위해선 오로직 $c_1 = ...
[선형대수] 1차 연립방정식 풀이와 직교벡터 구하기 orthonormal basis vetor인 경우 $v_1, v_2,... ,v_n$이 있다. C 구하는 법 $X= \Sigma c_iv_i$가 수직이 아닌 경우, V의 역함수로 c를 구할 수 있다. 만약 수직이라면 다음과 같은 공식을 사용할 수 있다. $c_i= v_i^Tx = \frac{v_i^Tx}{v_i^Tv_i=1}$ gram-schmidt orthognalization independent vectors들로orthonormal한 basis vector를 구하는 공식 (orthonormal basis vector이면 계산하기 쉬움) https://www.slideshare.net/ahra-cho/12-gramschmidt-orthogonalization?next_slideshow=1 선형대수 1..
[선형대수] 벡터투영과 최소제곱법 Projection(투영)으로 가장 가까운 거리를 찾아낼 수 있다. 선형대수를 미지수와 방정식 수로 나타내면 크게 3가지로 나눌 수 있다. 1. 미지수의 수= 방정식의 수: unique 한 값을 가짐 2. 미지수의 수 방정식의 수: 해가 없음 1,2번의 경우 가우스 조던법을 사용해서 문제를 풀 수 있다. 이번에 배울 3번의 경우는 '최소제곱법'으로 풀 수 있다. 이는 error를 가장 최소로 하는 space를 구한다는 뜻이며, 최소 거리를 구한다는 뜻이다. 식으로 표현하면 다음과 같다. 최소 제곱법 (Least square) $min||Ax-b||^2$ 내적과 cosine https://ekdud7667.tistor..
[선형대수] 벡터의 직교성과 직선투영 직교성(orthogonality) 벡터가 수직이라는 뜻은 linearly independent basis하다는 뜻이며, linear combination의 계산이 쉽다. - $x^t y=0$ 증명) 아래와 같은 벡터가 있을 때 피타고라스의 정리로 증명할 수 있다. $x^T y=0$ 이면 $\theta= 90$ $x^T y 90$ $x^T y>0$ 이면 $\theta
[선형대수] 선형변환과 행렬 Linear Transformation 행렬 연산은 벡터를 변환하는 것으로도 볼 수 있다. 벡터$x \in R^n$을 벡터$b \in R^m$으로 차원 변환시킨다고 할 수 있다. 또, 다음과 같은 변환도 있다. 1. 스칼라배 변환 $\begin{bmatrix} c &0 \\ 0 &c \end{bmatrix}$를 곱하면 c배로 변환한다. (c>0: 확대, c \frac{d}{dt}p(t) = 1-2t-3t^2$ 5. 다항식 적분(integration) 미분과 똑같이 표현하면 $x= \begin{bmatrix}a_0\\ a_1\\ ...\\ a_n\end{bmatrix}$, $y= \begin{bmatrix}0\\b_1\\ ...\\ b_{n+1}\end{bmatrix}$ 따라서 미분 변환은 $x \in R..