본문 바로가기

고등학교/확률과 통계 (고등학교 3학년)

대푯값의 의미 | 특강

728x90
반응형

오늘은 특강으로 통계를 설명해보려고 합니다.

 

먼저 대푯값을 생각해야 합니다.

대푯값의 의미는 자료의 특성을 대표하는 값입니다.

그러나 더 나아가 기하학, 대수학, 해석학을 생각해보면

어떤 문자를 읽고 그 성질을 파악하며 그 이미지를 생각할 수 있는 것이 중요합니다.

 

즉, 대푯값으로 자료의 분포를 생각할 수 있어야합니다.

대푯값에는 가장 많이 알려진 3가지 평균, 중앙값, 최빈값이 있습니다.

그 중에 평균은 산술평균, 기하평균, 조화평균이 있습니다만 일반적으로 산술평균을 평균이라 생각합니다.

산술평균은 자료의 모든 값의 합을 자료의 총 개수로 나누어 구한 값을 말합니다.

우리는 흔히 평균을 생각하면 다음과 같은 분포를 떠올리기 쉽습니다.

그러나 우리가 기대한 것과 다르게 실제 자료의 특성, 분포는 그렇지 않습니다.

새로 제시한 2가지 분포도 첫번째 분포와 같은 평균을 가지고 있습니다.

우리는 평균을 생각할 때 자연스럽게 떠오르는 첫번째 이미지를 개선할 필요가 있습니다.

 

중앙값도 대푯값 중 하나이므로 살펴보겠습니다.

중앙값은 변량을 작은 값부터 순서대로 나열했을 때(물론 큰 값부터 나열해도 같을 것입니다.) 중앙에 위치하는 값입니다.

15, 15, 15, 15, 15 중앙에 있는 값은 15입니다.

12, 12, 16, 19, 19 중앙에 있는 값은 16입니다.

11, 12, 15, 18, 19 중앙에 있는 값은 15입니다.

중앙값과 평균을 고려하면 조금 더 분포를 예상하기 쉬운 것 같습니다.

그렇지만 예상하기엔 조금 부족한 것 같습니다.

다음은 대푯값 중 하나인 최빈값입니다.

15는 5번으로 가장 많이? 나타납니다.

12가 2개, 16이 1개, 19가 2개이므로 12와 19는 가장 많이 나타납니다.

11, 12, 15, 18, 19는 모두 1개씩 나타납니다. 이때 수학적으로 최빈값이 없다고 이야기합니다. 

평균=중간값=최빈값

또는

평균 < 중앙값 < 최빈값

또는

최빈값 < 중앙값 < 평균

 

위 경우에 따라 어떤 분포를 그릴 지 예상해보면

대푯값이 자료의 분포를 나타내는 지표로도 쓰이는 것을 알 수 있습니다.

우리는 특히 평균을 많이 사용합니다.

이때 분포를 정확하게 이해하기 위해서 산포도가 필요합니다.

다음 특강에는 분산과 표준편차에 대해서 살펴보도록 하겠습니다.


유튜브 '독해진수학' 강의 영상

 "아래 사진을 클릭하여 영상 보기"


독해진수학
[티스토리-블로그] comprejin.tistory.com

복습을 위해 간단하게 이동 중에 내용 정리가 필요하거나 문제를 풀다가 필요한 개념을 확인하고 싶을 때 이용하면 좋습니다.

 

[유튜브] 문제풀이 및 개념 영상: '독해진수학'을 검색해주세요.
독해진수학의 장수를 위해 구독과 좋아요. 응원 댓글을 부탁드립니다.

728x90
반응형