29가지 통계 개념 - 통계학에서의 10% 조건이란 무엇인가?

모집단과 표본집단을 이용하는 경우 통계학에서 말하는 10% 조건이 무엇인지에 대해 알아보자.

10% 조건

10% 조건이란 표본의 크기가 모집단 크기의 10%를 넘지 않아야 한다는 것이다. 통계학에서 표본이 관련된 경우라면, 여러분이 완전한 결과를 얻었는지 확인하기 위해 이 조건을 확인하길 바란다. 몇몇 통계학자들은 표준 정규 모형을 사용하는 경우라면 10% 조건보다 5% 조건이 더 낫다고 말하기도 한다.

sample_population

예를 들어, 10% 조건은 다음과 같은 경우에 적용할 수 있다:

  • 중심 극한 정리(Central Limit Theorem)에서 비복원 추출을 하는 경우
  • 두 집단에서 비율을 가지고 있는 경우
  • 아주 작은 모집단이나 아주 큰 표본에서 평균의 차이를 확인하는 경우
  • Student’s t-test 를 사용하는 경우
  • 독립적이지 않은 베르누이 시행을 다루는 경우. 일반적으로 베르누이 시행은 독립적이나, 표본의 크기가 모집단의 10% 보다 크지 않은 경우에는 이 법칙을 거스르는 것도 괜찮다.

다음과 같은 경우에는 10% 조건을 일반적으로 확인하지 않는다:

  • 카이제곱 검정(Chi-square test)을 하는 경우
  • 평균의 차이를 확인하는 경우(작은 모집단이나 아주 큰 크기의 표본이 아닐 때)
  • 임의 실험을 하는 경우(임의 실험에서는 표본 추출이 없기 때문에 10% 조건을 사용할 수 없다)

일반적으로, 통계적인 의미로 10% 조건을 언급한 것을 찾기는 힘들 것이다. 부분에 대한 추론을 해야하는 경우라면 대표본 때문에 10% 조건이 필수적이다. 하지만 평균에 대해서는 표본의 크기가 더 작기 때문에 아주 작은 모집단에서 표본을 추출 하는 경우에만 이 조건을 필요로 한다.

이 조건이 베르누이 시행에 적용되는 이유는 대부분의 경우 비복원 추출을 하기 때문이다. 예를 들어 “예”와 “아니오”를 묻는 전화 설문 조사라면 이미 그 질문에 대답한 사람을 다시 조사집단에 넣진 않는다는 뜻이다.

10% 조건은 어디서 온 것인가?

이 조건에 대한 가정을 뒷받침해주는 수학적인 증명이 있기 때문에 이는 통계학적으로 적절하다. 이에 대한 증명은 기초 통계학이나 고등학교 수준의 통계학을 넘어서지만, 이 조건을 뒷받침하는 원리에 대해 더 알고 싶다면 텍사스대학교에서 제공하는 자료를 한 번 확인하라.

출처

10% Condition in Statistics: What is it?: 2023-10-20 현재 해당 주소로는 접근이 불가능한 것으로 확인했습니다.

2023

영어랑 친해지는 방법

7 minute read

가장 좋은 방법은 당연히 영어 밖에 사용하지 못하는 환경에 강제로 처해지는 것이겠지만 그것이 어려우니…

Back to top ↑

2022

Back to top ↑

2020

사내 스터디에 대한 회고

2 minute read

회사 서비스의 추천 시스템을 개선하기 위해 팀 내에서 (아직까진 두 명이긴 하지만) 지난 두 달 동안 스터디를 진행했습니다. 얼마 전 두 번째 스터디가 끝났고 이에 대한 회고를 해보려고 합니다.

Back to top ↑

2019

GitHub Pages Jekyll Blog 에 MathJax 추가하기

3 minute read

이 글은 MathJax 를 GitHub Pages Jekyll blog 에 추가하는 방법을 다룬다. 이탤릭체로 된 부분은 본문에는 없고 제가 따라하면서 고치거나 추가한 부분이니 참고하세요.

GitHub 블로그에 Jupyter notebook 올리는 방법

4 minute read

여러분의 GitHub 블로그에 Jupyter notebook 을 바꿔서 올릴 수 있도록 도와줄 글입니다. 직접 바꾸는 방법은 1회성 글들을 위해서 추가했고, 변환 과정과 파일 이동, 그리고 여러분의 블로그에 올리는 것까지 한 번에 할 수 있는 자동화 bash 를 만드는 자세한 방법...

Back to top ↑