인공지능 및 기계학습 개론 . 2강 Fundamentals of Machine Learning

edwith 인공지능 및 기계학습개론 강의를 참고하여 만들어진 포스트입니다.

0. 머신러닝의 정의 복습

머신러닝의 정의

  • 경험에 의해서 점점 퍼포먼스 향상
  • 더 나은 function approximation을 찾는 것

1. Rule Based Learning

  • rule based learning
    • version space: general 과 specific 사이
    • candidate elimination algorithm 이 verision space 만드는 알고리즘
    • 가정이 perferct world라서 보통 현실에서는 한계가 있음.

2. Decision Tree

*몇몇 입력 변수를 바탕으로 목표 변수의 값을 예측하는 모델을 생성

참고 : archive.ics.uci.edu/ml/datasets/Credit+Approval -> ml algorithm 성능 측정할 때 사용.

하나의 예측변수를 활용하여 타겟 변수 예측.

  • 어떤 특성을 선택하냐에 따라 성능 달라짐.

entropy (of a random variable)란??

불확실성을 측정하는 수단이다. (measure the uncertainty of a feature variable)

random variable의 확률분포가 알려지지 않은 만큼, 불확실성이 커진다.

information gain이란?

예측변수1의 IG = entropy(타겟변수) - entropy(타겟변수 예측변수1)

information gain이 가장 큰 변수를 선택하여 타겟변수 예측

  • deicision tree의 한계
    • decision tree의 크기가 좋을 수록(node 높일수록) 반드시 좋은 것은 아니다. overfitting 문제

entropy 에 대해 ??

3. Linear Regression

주어진 데이터를 나타내는 최적의 직선을 찾아냄으로써 input (x)와 output (y) 사이의 관계를 도출해내는 과정

entropy 추가 설명 with cross entropy

deep learning 에서는 cross entropy 라는 개념도 있는데, 한꺼번에 설명해주는 글을 찾았다.

https://medium.com/@vijendra1125/understanding-entropy-cross-entropy-and-softmax-3b79d9b23c8a