지난주 위대한 탄생을 재밋게 봐서 그 멘토 점수와 시청자 투표 결과를 찾아보고 싶었는데, 투표 결과는 비밀이라고 한다. 이유는 다음 투표에 영향을 미치지 않을까 하는 제작진의 판단 때문이였다.
여튼 찾을 수 있는 멘토 점수를 가지고 이런 저런 생각을 해봤다.
> witan <- read.csv("d:/witan/witan.csv")
> witan
이름 최종결과 순위 방시혁 이은미 신승훈 김태원 김윤아 멘토
1 데이비드오 합격 6 NA 8.7 8.8 8.9 9.0 방시혁
2 노지훈 합격 5 NA 9.2 8.9 8.9 8.6 방시혁
3 권리세 불합격 6 9.2 NA 8.8 8.9 8.5 이은미
4 김혜리 합격 1 9.0 NA 8.8 9.6 8.9 이은미
5 황지환 불합격 8 8.7 8.9 NA 8.5 9.0 신승훈
6 조형우 합격 10 8.6 8.9 NA 9.0 8.5 신승훈
7 쉐인 합격 8 8.8 8.6 NA 9.0 8.7 신승훈
8 이태권 합격 3 8.9 9.0 9.0 NA 8.9 김태원
9 손진영 합격 12 8.6 8.0 8.3 NA 8.5 김태원
10 백청강 합격 2 8.9 8.9 9.0 NA 9.4 김태원
11 정희주 합격 4 8.6 8.6 9.0 9.5 NA 김윤아
12 백새은 합격 11 8.5 8.7 8.7 8.9 NA 김윤아
> summary(witan[4:8])
방시혁 이은미 신승훈 김태원 김윤아
Min. :8.50 Min. :8.000 Min. :8.300 Min. :8.500 Min. :8.500
1st Qu.:8.60 1st Qu.:8.625 1st Qu.:8.800 1st Qu.:8.900 1st Qu.:8.525
Median :8.75 Median :8.800 Median :8.800 Median :8.900 Median :8.800
Mean :8.78 Mean :8.750 Mean :8.811 Mean :9.022 Mean :8.800
3rd Qu.:8.90 3rd Qu.:8.900 3rd Qu.:9.000 3rd Qu.:9.000 3rd Qu.:8.975
Max. :9.20 Max. :9.200 Max. :9.000 Max. :9.600 Max. :9.400
NA's :2.00 NA's :2.000 NA's :3.000 NA's :3.000 NA's :2.000
> boxplot(witan[4:8])
위 데이터에서 보면 일단 김태원의 경우 극단적인 점수를 주는 경향이 좀 있으며 평균적인 점수대도 높다. 아지만 가장 많은 특이점을 가지고 있고 낮은 특이점인 황지환은 그날 떨어졌다. 그리고 김윤아가 가장 낮은 점수를 준 권리세도 역시 떨어으나 김윤아는 낮은 점수에 대해서는 별다른 변별력은 없는데 박스그림을 보면 낮은 점수대에 대한 바깥 울타리가 없다는 것을 보면 이런 점을 알 수 있다. 하지만 이중에 포함된 손진영은 다른 멘토인 이은미와 신승훈의 낮은 이상치 데이터에 있는 것을 확인할 수 있는데, 이것뿐만 아니라 평균점도 가장 낮은 축에 드는 사람이라서 아무래도 나중에 가장 떨어질 확률이 큰 사람이지 않을까 하는 생각을 해본다. 그리고 방시혁의 최하점인 백새은도 평균으로 보나 확률이 크다.
분포로 본다면 방시혁 멘토가 본인의 낮은 중앙값이나 평균점수를 논외로 분포가 가장 균등하게 되어 있음을 알 수 있다. 나름대로 방시혁 멘토는 본인의 점수 기준이 다양하다는 것을 보여주고 있다. 그러나 1차 탈락자인 권리세가 본인의 점수중에서 가장 큰 점수를 받았다는 것은 눈여겨 볼 대목이다(역시나 기획사 프로튜서의 안목이라서 그런지…). 김태원이나 신승훈은 왠만에서는 기준점 이상을 주고 있으나 본인의 특별한 기준에 의해서 몇몇에 대해 차별된 점수를 주고 있었다. 특히나 김태원은 그런 특징이 많았는데, 이런 부분에서 김태원, 신승훈의 성향을 살짝 엿볼 수 있었다.
많은 분들이 예상 대로 별다른 이변이 없는 이상 다음 탈락은 “백새은”, “손진영”이 되지 않을까 살짝 예상해 본다.
시청자 투표 결과가 있었으면 참 좋았을거 같은데, 상당히 아쉽다.
그리고 멘토 상호간 점수를 주는 정도에 따라서 서로간의 알력이라든지 경쟁심리가 표출되지 않았나 하는 예상을 하시는 분들이 많은데, 이 데이터로는 그런 부분을 감지하기가 어렵다. 데이터가 너무 적기 때문이다.
이제 이은미는 멘티가 1명 남았다. 아마도 그마저도 떨어지면 그에 대한 cost는 클 것이기 때문에 다음회에서는 어떻게든 살아남게 할 것이다. 그러기 위해서 이은미는 다른 멘토들의 멘티들에 대해서 더욱 짠 점수를 줄 가능성이 많아졌으며 김혜리의 노래 선정이나 연습에 사활을 걸 것으로 보인다. 다음주의 이은미 점수대도 상당히 볼만할 듯 하다. 이번하고 비슷한 분포는 절대 아닐거라 예상한다.
글을 쓰다 보니 다음 탈락자가 누구일까 생각하는 것보다 멘티가 줄어들수록 멘토들의 점수가 어떻게 분포할까 그리고 각 멘토의 마지막 멘티 한명이 남았을때 멘토가 어떤 성향을 보일까가 너무 궁금해진다.

와, 단순한 boxplot만으로도 이정도의 분석이 가능하네요 ㅋㅋ 신기합니다
그래서 boxplot을 통계학 대다수 과목의 첫부분에 언급하고 있죠. ^^
요즘 학교 전공으로 R을 듣고 있는데 뭔가 Lisp나 ML느낌나서 즐겁게 배우고 있습니다. ㅋ
전공으로 R을 듣고 계시다면 통계학과 이신가요? (궁금….그리고 어떤 과목인지도 궁금…)
아무래도 Lisp의 영향을 받은 언어라서 일반적인 C,Java 개발자들은 의외로 배우기 힘들어 하시더라구요. 특히나 Vectorization의 경우는 처음에 적응하기 힘들죠. ㅋ
이런 것을 보면 전공이라는게 단순히 기술(Skill)에 국한된 게 아니라 마인드가 더 중요한 것을 알겠네요 ㅠㅠ 아직 전 통계학적 마인드가 부족한가 봅니다.
재연님… 멋진 말씀 해주시고 가시네요. ㅋㅋㅋㅋ
정말 기술, 기법 보다는 의지 혹은 마인드가 중요하다는말 완전공감합니다.
아직 새파란 학부생이고(이놈의 학교는 몇년째 다니고 있는거지;;)
본전공 컴퓨터공학과에 이중전공으로 통계학과 듣고 있습니다.
원래 통계학과 한 것도 금융공학이나 파이낸스 이 쪽으로 나가려고 선배가 꼬드겨서
들은건데
작년에 임해창교수님 수업 들으면서 검색이나 데이터 마이닝 쪽에 관심이 많이 생겨서
요즘 고민중인 학부생입니다 ㅠㅠ
학부시절에 좋은 선배들이 좋은 말씀을 해주시는거 같네요.
이중 전공으로 통계학 듣는건 정말 선견지명이 있는겁니다.
오래전에는 통계학과하고 컴공이 같은 과였다죠? 이제는 다시 합쳐져야 하지 않을까 하는 생각도 가끔합니다.
저는 이제야 통계학을 방송대에서 공부하고 있구요, 임해창 교수님 밑에서 데이터마이닝과 기계학습, 검색 공부하다가 부족한듯 해서 여기까지 왔네요. ㅋ
곧 스승의 날이니 예년과 같이 한번 찾아뵈어야 겠습니다.
무쪼록 건승하시길 바랄께요. ^^
참 그리고…
통계학과 허명회 교수님 한번 뵙고 싶다는 생각이 요즘 자꾸 드는데… 거기 수업 들어가시나요?
박사를 한다면 통계학에서 하고 싶다는 생각까지 드는 중이라서요. ㅋ
허명회 교수님의 법과 통계학 듣고 있습니다. 통계학과 내에서도 정말 대단한 교수님이
라고 많은 말 들었는데, 정말 그러한 분 같습니다.
수업을 듣는다니 부러울 따름입니다.
저는 책이나 컬럼으로만 만나뵈어서요.
다시한번 꼭 만나뵈어야 겠다는 생각이 드네요.
멋지십니다. 같은 자료를 봐도, 관심에 따라서 이렇게 결과가 다를 수가 있구나를 느끼게 해주시는 블로깅이시네요 ^^
분석은 ‘꿈보다 해몽이죠’.. ㅋ