많은 자료를 대표하는 하나의 양이 평균이라면, 이 자료들이 얼마나 평균 주변에 모여 있는지를 알아야 할 때가 있다. 자료 하나하나가 평균에서 어느 정도 떨어져 있는지를 알려면 그냥 그 자료와 평균의 차를 구해보면 된다. 이것을 편차라 한다. 그러나 자료가 많으면 많을수록 편차 하나하나를 살펴보기가 어려우므로, 여러 편차들을 대표할 수 있는 하나의 양이 필요하다. 이것을 “흩어져 있는 정도”라는 뜻에서 산포도(散布度, dispersion)라 한다.
평균 가운데 가장 흔히 쓰이는 것이 산술평균이라면, 산포도 가운데 가장 흔히 쓰이는 것은 표준편차(standard deviation)이다. 이름부터 벌써 “표준”이지 않은가. 그렇지만, 다양한 평균이 있듯이, 다양한 산포도가 존재한다. 다른 산포도를 알아보기 전에, 왜 표준편차는 편차의 제곱을 이용하는지부터 생각해 보자.
|