로그인 바로가기 하위 메뉴 바로가기 본문 바로가기

데이터 과학 산책

임시 이미지 KAIST 수리과학과 김성호 교수
http://kooc.kaist.ac.kr/walkingds19/forum/12544
좋아요 1738 수강생 3359

안녕하세요 좋은 강의 잘 듣고 있습니다. 

강의 내용중 궁금한것이있어 2가지 질문드립니다.


1. 챕터4에서 나라별 murder, assault등으로 정리된 데이터로 위계적 군집분석할 때, 

각 나라별로 murder, assault, urbanpop, rape 총 4개의 개별값을 가지는데 4개의 값이 오차제곱합공식에 의해 1개의 값을 가지게 되고 좌표에서 1개의 값으로 계산되는게 맞나요?

2. 단어구름 사례2에서 한글을 이용한 방법을 배웠는데 여기서 빅테이터 라는 단어를 뽑아내기 위해 '빅테이터는', '빅테이터와'등 조사가 붙은것을 '빅테이터' 단어로 처리하는 과정이 있는데 그말은 즉 '빅테이터' 단어를 뽑아내기 위해 빅테이터에 붙은 조사를 다 알아야한다는 것 같은데 그렇게 되는게 맞나요?ㅠ 그렇게 되는게 맞다면 정말 긴 문장의 글에서 한단어를 뽑아낼때 많이 복잡해지는것 아닌가요? 


비전공자라서 잘 모르는 부분이 많아 질문드립니다.