정치 여론조사에서 오차 범위
여러분,
많은 사람들이 올해 대통령 선거에 사로잡혀 있습니다. 또한 어떤 분들은 일상적으로 논의되는 여론조사 수치에서 “오차 범위”가 의미하는 것에 의아해 할 수도 있습니다.
여론조사 통계는 이항 분포로 설명됩니다. 이 분포는 예/아니오, 앞면/뒷면, 참/거짓, A 후보/B 후보 등의 데이터를 설명하기 위해서 개발되었습니다. 데이터의 속성 또는 그 중 하나는 베르누이 시행으로 불리우는 것입니다.
일례로서, 동전을 1000 번 던져서 나오는 횟수를 추정해 봅시다. 앞면이 나올 확률은 500이 될 수 있지만, 앞면이 492 또는 507번 나오더라도 놀라지 않을 것입니다. 앞면이 단지 200번 나온다면 확실히 놀라시겠죠. 아래 그림은 이 상황에 대한 이항 분포를 보여줍니다.
그림: 대략 95%의 횟수에서, 동전을 1000번 던져서 앞면이 나올 수 있는 결과는 468과 532 사이입니다.
468 이하 또는 532 이상인 붉은 색 부분을 주목해 주세요, 이 부분은 앞면이 468 이하 또는 532 이상 나올 확률이 단지 5% 인 통계적 유의성입니다. 작은 반올림 오차가 있으므로 실제 수치는 5%보다 약간 작은, 4.63%입니다.
따라서 동전을 1,000회 던졌을 때 약 95%, 앞면이 나올 수치는 468과 532 사이가 될 것입니다. 세계는 통계적 유의성에 대한 기준으로서 이 “95%”에 맞춰있습니다. 따라서 앞면의 숫자는 약 +/- 3.2% (32 이상 또는 500 이하, 1,000으로 나눈) 1,000번 동전을 던졌을 때 95%로 달라질 것입니다. 이 +/- 3.2%가 “오차 범위”이고, 또한 MOE를 의미합니다.
이제 이것을 대통령 선거 여론조사와 연관지어 봅시다. 여론조사 요원들은 국가를 대표하는 표본 사람들의 여론을 조사하기 위해서 최선을 다합니다. 이것은 사소한 일이 아닙니다. 그러나, 공정한 표본을 가지고 있다고 가정할 때, 심지어 50/50 경선에서, 동전을 던지는 것과 같이, 그들은 50/50 표본을 가질 필요가 없을 것입니다. 그들의 결과는 마치 동전을 던지는 것과 같이, 심지어 50/50 경선에서도, 95%의 횟수는 468에서 532일 것입니다.
대부분의 여론조사는 약 3%의 MOE를 나타내며, 따라서 우리는 표본의 크기가 약 1,000이라는 것을 압니다.
감사합니다,
론 박사
Connect with Indium.
Read our latest posts!