공식이 아니라, 경험입니다 – 인수분해를 이해하는 진짜 방법
숫자, 그대로 믿어도 될까요?
뉴스나 SNS를 보다 보면,
“지지율 52%, 격차 6%p, 오차범위 밖” 같은 숫자들이 자주 등장합니다.
이런 수치를 보고 우리는 종종
‘이긴 건가 보다’, ‘이미 대세가 정해졌네’라고 생각하곤 하죠.
하지만 정말 그럴까요?
여론조사, 그 숫자는 어떻게 만들어질까?
여론조사 결과는 모든 사람을 조사한 게 아니라,
일부만 조사해서 전체를 추정한 수치입니다.
이를 **표본조사(sampling)**라고 부릅니다.
#표본조사의 수학적 정의
전체 집단(모집단)에서 일부 대상을 선택하여
모집단의 특성을 추정하는 통계적 방법.
출처 입력
예를 들어,
대한민국 유권자가 약 4천만 명이라면,
그 중 1,000명만을 뽑아 조사해서 전체의 의견을 추정하는 것이죠.
그렇다면, 누구를, 어떻게 뽑느냐가 중요하지 않을까요?
표집 방식이 결과를 좌우한다
표본조사에서는 표집 방법이 가장 중요한 요소 중 하나입니다.
🔹 무작위 표집 (Random Sampling)
- 모든 유권자에게 뽑힐 확률이 동일하도록 설계
- 통계적으로 가장 신뢰성이 높음
- 수학적으로는 ‘확률표본(probability sample)’이라 부릅니다.
🔹 편의 표집 (Convenience Sampling)
- 접근 가능한 사람, 연락이 되는 사람만 조사
- 빠르지만 대표성 부족
- 예: 휴대폰이 연결된 사람만 대상으로 여론조사를 실시
# 이처럼 표집 방식이 잘못되면,
조사 대상이 특정 집단에 편향되고,
결과도 자연스럽게 왜곡될 수 있습니다.
오차는 피할 수 없다 – 표본오차와 비표본오차
표본조사에는 두 종류의 오차가 존재합니다.
📐 표본오차 (Sampling Error)
무작위로 표본을 추출했을 때,
실제 모집단의 특성과 차이가 날 수밖에 없는 통계적 오차.
출처 입력
예)
1,000명을 무작위로 뽑았을 때 ±3% 오차가 발생할 수 있다는 말은,
실제 수치는 ±3% 내외로 흔들릴 수 있다는 뜻입니다.
일반적으로,
표본 수가 많을수록 오차는 줄어듭니다.
하지만 오차를 절반으로 줄이려면,
단순히 표본을 두 배가 아니라 네 배로 늘려야 합니다.
→ 오차는 표본 수의 제곱근에 반비례합니다. (∝ 1/√n)
비표본오차 (Non-Sampling Error)
표본 추출 외의 요인으로 발생하는 오류.
수학적으로 보정이 불가능합니다.
출처 입력
대표적 사례)
- 질문이 유도적이었거나
- 특정 시간대에만 전화를 했거나
- 응답자가 속마음을 숨겼거나
➡ 아무리 많은 사람을 조사해도,
이러한 오차는 숨어 있는 왜곡을 초래할 수 있습니다.
수학이 알려주는 건 숫자 너머의 시선
우리는 숫자를 볼 때, 그 자체만을 보게 됩니다.
하지만 수학은 언제나 숫자가 만들어지는 구조, 전제, 맥락을 함께 보라고 말합니다.
수치는 계산되지만,
해석은 사유를 통해 이루어집니다.
숫자가 정확하다고 해서,
그 숫자가 말하는 의미도 정확하다고 믿을 수 있을까요?
출처 입력
여론조사의 숫자도 마찬가지입니다.
신뢰도는 단순한 수치에 있는 게 아니라,
그 수치를 만들어낸 논리적 구조와 조건 안에 있는 것이죠.
비판적 사고는 수학에서 시작된다
비판적 사고란,
무조건 의심하는 것이 아니라
‘어떻게 만들어졌는가’를 살펴보는 태도입니다.
수학은 바로 그런 태도를 훈련시키는 학문입니다.
우리가 여론조사 수치를 볼 때도,
그 숫자 너머의 과정을 이해하려는 노력이 필요합니다.
▶️ 영상 보러가기
YouTube에서 마음에 드는 동영상과 음악을 감상하고, 직접 만든 콘텐츠를 업로드하여 친구, 가족뿐 아니라 전 세계 사람들과 콘텐츠를 공유할 수 있습니다.
youtu.be
숫자는 정확할 수 있지만,
숫자가 말하는 진실은 언제나 맥락 속에 있습니다.