인공지능 및 기계학습 개론 . 1강

edwith 인공지능 및 기계학습개론 강의를 참고하여 만들어진 포스트입니다.

machine learning, data mining이런게 다 무엇인가?

social network, text data, time series 등등에서 원하는 정보를 얻어내는 것

machine learning의 종류

  1. supervised learning

    답이 있는 학습(classification, regression)

  2. unsupervised learning

    기계가 스스로 분류하거나 패턴을 찾는 것

  3. reinforcement learning

Binomial Distribution

연속된 n번의 독립적 시행에서 각 시행이 확률 p를 가질 때의 이산확률분포,  n=1일 때 이항 분포는 베르누이 분포

관련 통계적 개념 1. MLE

가정의 설득력을 높이려면, 그럴듯한 theta를 찾아야 한다. mle는 그에 대한 해답인데, 모수 theta가 주어졌을 때 주어진 데이터가 나올 확률이 가장 높게 나오게 하는 theta이다.

어떤 확률변수에서 표집한 값들을 토대로 그 확률변수의 모수를 구하는 방법

관련 통계적 개념 2.Simple Error Bound

추측한 mle와 실제 모수값의 차이는 N이 늘 수록 적어진다.

관련 통계적 개념 3.MAP(Maximum a Posteriori Estimation)

MLE의 bayesian ver.라고 볼 수 있는데, MAP는 posterior distribution 에서 최대를 본다.

MLE를 명료하게 설명하면?

친절설명사이트에서 가져온 그림으로 바로 설명이 되는데,

mle

$L(\mu,\sigma ; data)$는 주어진 데이터를 설명하는 모델의 파라미터가 얼마나 그럴듯한지 알려주는데, mle는 그 likelihood를 최대로 하는 추정량이다. 즉, 간단히 얘기하면 mle는 주어진 데이터를 가장 잘 설명하는 모델의 모수 추정량인 것이다.</u> 그래서 그림에서처럼 점으로 데이터가 주어졌을 때, 가장 잘 설명하는 모델인 f1의 파라미터를 가져오면 mle라고 할 수 있다.

확률 분포

확률 변수가 특정한 값을 가질 확률을 나타내는 함수