안녕하세요. 저는 대학원에서 통계를 전공하고 IT 개발에 몸담고 있습니다. 저도 통계를 그다지 잘 모르지만 실생활에서 유용하게 쓰이고 잘못 이해할 수 있는 통계에 관한 이야기들을 주립대학 학생분들 게 전달하고자 합니다.
평균을 우리는 중학교 ( 중학교 졸업한 지 오래돼서 정확하지는 않습니다. ^^ )에서 배웠을겁니다. 평균이란 어떤 집단을 나타내는 대푯값으로 실생활에서도 많이 쓰이고 있습니다. 예를 들어 1반의 수학 평균이 70점이다. 프로야구 구단 선수들의 평균 연봉이 얼마 다라는 식으로 쓰이고 있습니다.
평균을 식으로 볼까요? ( 그다지 어렵지 않습니다. 흠 )
위와 같은 식으로 표시를 합니다. 모든 값을 더하고 그 개수로 나누면 평균값이 나오지요.
좀 더 어려운 말로 하자면 위 평균은 산술평균입니다. 기하 평균이니 조화평균이니 하는 다른 평균도 있지만 저도 잘 몰라서 패스하도록 합니다.
아래 표에서 삼성 라이온즈의 선수 연봉이 있습니다. ( 가상의 값입니다. )
심창민 |
3,000만원 |
양준혁 |
5억원 |
김상수 |
2억원 |
박혜민 |
5,000만원 |
구자철 |
1,000만원 |
평균을 구해보면 30,000,000+500,000,000+200,000,000+50,000,000+10,000,000 / 5하게 되면 일억 오 천팔백만 원 ( 맞겠죠? )입니다.
위에서 평균은 집단을 나타내는 대푯값이라고 했습니다. 삼성라이온즈 선수 5명이 보통 일억 오 천팔백만 원의 연봉을 받는다는 얘기가 되죠.. 여러분들은 여기에 동의하시나요?
여기에서 평균의 함정이 발생됩니다. 고액 연봉자들의 연봉이 커지면 커질수록 더욱 평균은 커지게 되고 대푯값으로서 문제가 발생하게 됩니다.
이를 보완하는 값이 중간(앙) 값입니다. 중간값은 데이터를 크기순으로 정렬한 다음 가운데 있는 값을 선택한 값이 됩니다.
위의 표에서 중간값은 1000,3000,5000,20000,50000으로 정렬되고 오천만 원이 중간값으로 선택되게 됩니다. 만일 데이터가 짝수 개일 경우는 가운데 있는 두 개의 값을 더해서 / 2 하면 됩니다.
정리해보겠습니다. 평균 : 일억 오천팔백만 원, 중간값은 오천만 원이 됩니다. 어느 것이 대푯값으로 더 적당할지는 상황에 따라 틀리지만 평균 하나만 가지고 집단의 성질을 이해하기에는 무리가 있어 중간값에 대한 정보도 같이 알면 더욱 좋겠죠?
다음 링크는 유튜브에서 평균의 함정에 대해 너무나 적절한 예를 든 것이 있어 공유해 드립니다.
https://www.youtube.com/watch?v=Pp_Pd6GZLOE
이상 강의를 마치도록 하겠습니다. 꾸벅 ~~
▲ 이전글 | 한글날 이벤트 당첨자 발표 (21) | |
▼ 다음글 | 여백의 이해 (5) (12) |