로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

인공지능 및 기계학습 개론 II

임시 이미지 KAIST 산업및시스템공학과 문일철 교수
http://kooc.kaist.ac.kr/machinelearning2__17/forum/6738
좋아요 1115 수강생 5473

안녕하세요.

10.3 마지막 슬라이드에서 importance sampling을 discrete 한 경우에 대해서 P(E=T|MC=T, A=F) 를 구하는 문제로 예를 드신 부분이 있습니다.

그리고 그 전 슬라이드에서 p(z) 와 q(z^l) 이 있습니다.  문제에서 p(z)와 q(z^l) 에 해당하는 것이 무엇인지 제 나름대로 생각해보았습니다.


제가 이해한 방식은,,

- (a) 어쨌든 sample을 하면 Z든 Z^l이든 5개 값(B,E,A,JC,MC) 값이 True 또는 False로 있는 vector 가 나온다고 할 수 있을것 같습니다.

- (b) 그러면 Z ~ p(z|MC=T, A=F) 라 하고 Z^l ~ q(z^l) 을 라고 할 수 있을것 같습니다.

- (c) 만약 z^l 을 샘플링했는데 B=F, E=F, A=F, JC=T,MC=T 가 나왔다고 했을때..

- (d) q(z^l)은 순서대로 0.999 * 0.998 * 0.999 * 0.05 * 0.01 가 됩니다.

- (e) p(z^l) 은 순서대로 0.999 * 0.998 * 1 * 0.05 * 1 이 됩니다. (관심있는 확률분포 Z ~ p(z|MC=T, A=F) 에서는 A=F, MC=T 인것만 고려하기 때문입니다)

- (f) 그러면 이전 슬라이드에서 SW=p(z^l)/q(z^l) 을 계산하면 1 / (0.999 *0.01) 만 남습니다. (동일한 곱샘 인수는 약분되어 사라집니다)

- 그러면 이것을 E=T인 경우에 대해서만 더한 SumSW 에서 항상 더한 NormSW로 나누면 적절히 normalize 되어 구하려는 확률이 나옵니다 ??


[1] 그런데 SW를 구하는 방식이 강의에서 는 0.999*0.01 로 되어서 제가 생각한 1/(0.999*0.01)이랑 다른것 같습니다. 제가 어디서 틀렸을지 궁금합니다. [2] 그리고 이전 슬라이드에서 샘플의 개수인 L을 예제에서는 사용하지 않은 부분도 어떻게 가능한지 궁금합니다.

감사합니다.