로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

인공지능 및 기계학습 개론Ⅰ

임시 이미지 KAIST 산업및시스템공학과 문일철
http://kooc.kaist.ac.kr/machinelearning1_17/forum/3509
좋아요 3574 수강생 17094

강의노트 part1의 slide 7 캡처입니다.

교수님께서 실선의 pdf를 그리는 모델과 점선의 pdf를 그리는 모델 2개가 있다고 하셨습니다.

이제 실선 모델을 f1,점선 모델을 f2라고 표현 하겠습니다. 

그러면, decision boundary(가운데 교차점 X(middle))을 기준으로

왼쪽에 있는 x에 대해서는 둘다 P(y(green) I X=x) > P(y(red) I X=x) 이니까, f1(x) = f2(x) = y(green)이 나오고, 

오른쪽에 있는 x에 대해서는 둘다 P(y(green) I X=x) = P(y(red) I X=x) 이니까 f1(x) = f2(x) = y(red) 이 나옵니다.

이제 질문입니다.

1) 그러면 모델 f1과 f2의 분류 결과는 어떤 x에 대해서도 항상 동일한 것 아닌가요?

2) 두개(점선, 실선)이 나타내는 확률은 모델이 training data를 기반으로 계산해서 나온 확률인가요? 즉 , 각자의 모델이 가진 식으로 계산된 pdf인가 여쭙는 것입니다. 같은 x에 대해 확률이 다르니 그렇게 밖에 생각 할 수 없는것 같은데, 맞는지 헷갈립니다.

3) 그렇다면 실선인 모델 f1은 점선인 f2보다 그냥 y에 대한 확률차이가 더 크게, y(green) 혹은 y(red)에 대해 조금 더 자신있게 예측 한 것 뿐이지 않나요? 차이가 조금나더라도 어쨌든 더 크면 똑같이 분류 할텐데요.

왜 교수님이 확률차이가 큰 f1이 더 낫다고 하시는지, 그게 왜 Error가 더 작은 것이고, 낮은 Risk를 갖는 모델인지 이해를 못했습니다. Error는 확률값의 계산과 별개로 실제로 틀리느냐 맞느냐의 문제일텐데, f1이나 f2나 틀리면 같이 틀리고 맞으면 같이 맞지 않나요? 

4) f1과 f2 둘 모두 TRAINING DATA를 기반으로 각자 argmaxY=y P(Y=yIX=x)를 구하므로 f*(optimal classifier)라고 할 수 있나요?

꼭 답변 부탁드립니다!