안녕하세요 조교님
수업을 듣다가 궁금한 점이 생겨서 질문을 남깁니다.
최적화된 theta를 구하는 후보 중 하나가 MLE의 theta라고 하면서 P(D/theta)가 최대가 되는 theta를 구하는데
왜 P(D/theta)가 최대가 되어야 하는지 모르겠습니다. 저한테는 P(D/theta)가 최대가 되는 것이 최적화되는 theta를 구하는데 큰 의미가 없어 보입니다. P(D/theta)가 높아진다고 해서 유의미한(최적화된) theta가 되는 이유가 무엇인가요?
comment