Written on th, by Hyeju Kim
인공지능 및 기계학습 개론 . 1강
edwith 인공지능 및 기계학습개론 강의를 참고하여 만들어진 포스트입니다.
machine learning, data mining이런게 다 무엇인가?
social network, text data, time series 등등에서 원하는 정보를 얻어내는 것
machine learning의 종류
-
supervised learning
답이 있는 학습(classification, regression)
-
unsupervised learning
기계가 스스로 분류하거나 패턴을 찾는 것
-
reinforcement learning
Binomial Distribution
연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산확률분포, n=1일 때 이항 분포는 베르누이 분포
관련 통계적 개념 1. MLE
가정의 설득력을 높이려면, 그럴듯한 theta를 찾아야 한다. mle는 그에 대한 해답인데, 모수 theta가 주어졌을 때 주어진 데이터가 나올 확률이 가장 높게 나오게 하는 theta이다.
어떤 확률변수에서 표집한 값들을 토대로 그 확률변수의 모수를 구하는 방법
관련 통계적 개념 2.Simple Error Bound
추측한 mle와 실제 모수값의 차이는 N이 늘 수록 적어진다.
관련 통계적 개념 3.MAP(Maximum a Posteriori Estimation)
MLE의 bayesian ver.라고 볼 수 있는데, MAP는 posterior distribution 에서 최대를 본다.
MLE를 명료하게 설명하면?
친절설명사이트에서 가져온 그림으로 바로 설명이 되는데,
$L(\mu,\sigma ; data)$는 주어진 데이터를 설명하는 모델의 파라미터가 얼마나 그럴듯한지 알려주는데, mle는 그 likelihood를 최대로 하는 추정량이다. 즉, 간단히 얘기하면 mle는 주어진 데이터를 가장 잘 설명하는 모델의 모수 추정량인 것이다.</u> 그래서 그림에서처럼 점으로 데이터가 주어졌을 때, 가장 잘 설명하는 모델인 f1의 파라미터를 가져오면 mle라고 할 수 있다.
확률 분포
확률 변수가 특정한 값을 가질 확률을 나타내는 함수