본문 바로가기

인공지능/스터디

(17)
최대우도추정 [https://ratsgo.github.io/statistics/2017/09/23/MLE/](https://ratsgo.github.io/statistics/2017/09/23/MLE/) [https://datascienceschool.net/view-notebook/dc6528fbf3ed4f9885e243198ef7694c/] 최대우도추정 최대우도추정(maximum likelihood estimation)이란 모수(parameter)가 미지의 θ인 확률분포에서 뽑은 표본(관측치) x들을 바탕으로 θ를 추정하는 기법입니다. 다시말해, 표본들을 보고 모수를 추정하는 것이다. 동전 던지기를 예를 들어보자. 동전 던지기는 이항분포를 따르며, 앞면이 나올 확률 p와 뒷면이 나올 확률 1-p로 이뤄진다. 이항..
Bias-Variance, underfitting-overfitting trade off 이 게시글은 팀블로그에서 참고했다. Bias- Variance 2. 편향-분산 트레이드 오프 (Bias-Variance trade off) 안녕하십니까 허브솔트입니다. 지난 시간에는 앙상블의 알고리즘들에 대해 알아보았는데요, 오늘은 편향 분산 트레이드 오프에 대해 공부해 볼께요! 편향 분산 트레이드 오프는 비단 앙상블에만 적용되는 것이 아.. data-matzip.tistory.com 딥러닝 머신러닝에서 underfitting과 overfitting의 트레이드 오프는 최종 성능에 중요한 역할을 한다. 이를 이해하기 위해선 Bias-Variance의 트레이드 오프 관계를 알아야 한다. 그럼 우선 Bias- variance를 알아보고 underfitting과 overfitting을 알아보자. 편향-분산 - ..
[CB Filtering] 2. 키워드 수집 Content based Filtering은 팀블로그에서 참고했다. Content based Filtering [CB Filtering] 1. 개요 Content-based Filtering vs Collaborative Filtering Content-based Filtering - 유저가 과거에 좋아했던 것과 컨텐츠가 유사한 아이템 추천 Collaborative Filtering - Rating을 기반으로 유저와 비슷한 성향을.. data-matzip.tistory.com 위의 그림이 저번에도 게시했던 CF알고리즘의 개요이다. 여기서 빨간 부분인, content를 어떻게 수집할지에 대한 '키워드 수집' 내용을 다루겠다. 키워드 수집을 할 때 대부분 TF-IDF를 활용한 vector space mode..
[Ensemble] 개요(Bagging, Boosting, Stacking) 아래의 포스팅은 팀블로그인 '데이터 맛집'에서 참고한 내용입니다. 팀블로그-앙상블 기법정리 [앙상블 기법 정리] 1. 앙상블(Ensemble) 기법과 배깅(Bagging), 부스팅(Boosting), 스태킹(Stacking) 안녕하세요, 허브솔트에요. 저희 데이터맛집의 허브솔트 첫 글 주제로 앙상블이 당첨됐네요...! 요새 캐글의 상위권 메달을 휩쓸고 있는 대세 알고리즘이 앙상블 기법을 사용한 알고리즘의 한 종류인 XGBoost라죠?.. data-matzip.tistory.com 앙상블은 여러 모델, 알고리즘을 결합하여 학습시키는 것으로 overfitting, underfitting을 예방하고 예측력을 보완시키는 등의 single로 사용할 경우 나타내는 단점들을 보완한다. Bagging Bagging은 ..
[CB Filtering] 1. 개요 Content based Filtering은 팀블로그에서 참고했다. Content based Filtering [CB Filtering] 1. 개요 Content-based Filtering vs Collaborative Filtering Content-based Filtering - 유저가 과거에 좋아했던 것과 컨텐츠가 유사한 아이템 추천 Collaborative Filtering - Rating을 기반으로 유저와 비슷한 성향을.. data-matzip.tistory.com Content based는 CF와 다르게, user의 rating을 기반으로 추천하는 것이 아닌, content 기반으로 추천하는 것이다. 예를 들어, 영화의 카테고리, 속도감, 화면이 전환되는 속도 등.. 영화의 특성을 묶어 추천..
Collaborative Filtering(CF: 협업필터링)2: 계산 Collaborative Filterting1: 개요 Collaborative Filtering(CF: 협업필터링)1: 개요 CF에 관한 내용들이 많아서 1과 2로 나눠서 게시했다. 1은 CF의 특징, 개념에 관한 내용이고, 2는 CF를 어떻게 계산하는지에 대한 직접적인 유도를 하는 내용이다. 관련한 모델 또한 추가로 정리했다. Collaborati.. ekdud7667.tistory.com CF의 특징 개념에 대한 설명의 위의 링크에 게시했으니 참조하길 바랍니다. 그럼 이제 item based와 user based를 사용할 때 어떻게 rating을 계산하는지에 대해 알아보자. 구현 절차 CF를 만들기 위해서는 여러 가지 절차를 거쳐야 한다. 1. rating matrix 정리: item based(it..
Collaborative Filtering(CF: 협업필터링)1: 개요 CF에 관한 내용들이 많아서 1과 2로 나눠서 게시했다. 1은 CF의 특징, 개념에 관한 내용이고, 2는 CF를 어떻게 계산하는지에 대한 직접적인 유도를 하는 내용이다. 관련한 모델 또한 추가로 정리했다. https://ekdud7667.tistory.com/10 Collaborative Filtering(CF: 협업필터링)2: 계산 Collaborative Filterting1: 개요 Collaborative Filtering(CF: 협업필터링)1: 개요 CF에 관한 내용들이 많아서 1과 2로 나눠서 게시했다. 1은 CF의 특징, 개념에 관한 내용이고, 2는 CF를 어떻게 계산하는지에 대.. ekdud7667.tistory.com Matrix Factorization(MF, 행렬분해) [CF] MF(M..
BPR-MF(Bayesian Personalized Ranking MF) 추천시스템의 CF에서 BPR을 적용한 MF기법이 있다. 추천시스템에서 오래전부터 많이 사용해오던 MF지만, BPR-MF는 다소 생소해 정리를 해봤다. 아래의 논문과 블로그를 참고했다. 논문: Modified Bayesian personalized ranking for non-binary implicit feedback 블로그: http://sanghyukchun.github.io/95/ https://itkmj.blogspot.com/2019/08/bpr-bayesian-personalized-ranking-from.html BPR은 상품간의 선호도를 확률 모형화를 한 모델이다. BPR은 개인이 선호하는 상품을 단계별로 카테고리화하여 분석을 진행한다(Positive items: 긍정적 상품/ Negati..