t 값에서 p 값 계산하기
여러분,
샘플 크기가 200 미만인 작은 경우, 정규 분포에 수정이 필요합니다. William Sealy Gossett는 Guiness Brewery에서 일하면서 이 수정 사항을 발견했습니다. 수정된 분포는 Gossett가 'Student'라는 가명으로 게시한 대로 Student T 분포라고 합니다. 오늘날 "Student"는 보통 삭제되고 그 분포는 "t 분포"로 알려져 있습니다.
t 분포의 문제 중 하나는 데이터의 각 자유도(DOF)에 대해 별도의 분포가 존재한다는 것입니다. t 분포의 경우, 자유도는 단순히 표본 크기에서 1을 뺀 값입니다.
예를 들어, 솔더 페이스트 전달 효율 데이터 샘플이 있다고 가정해 보겠습니다. 샘플 크기는 100이고, 평균이 100%라고 말할 수 있는지 확인하려고 합니다. Minitab으로 데이터를 분석하면(그림 1 참조), 평균이 105.40이고 평균 표준 오차가 1.03임을 알 수 있습니다.
그림 1. 위에서 논의한 데이터의 Minitab 분석.
H0 = 100 및 H1 ≠ 100으로 가설 검정을 하면, 이 양면 검정에 대해 t 값이 5.24로서 기각할 수 있는 귀무 가설임을 알 수 있습니다. Minitab에서는 p = 0.000이라고 알려줍니다. t 테이블(그림 2 참조)을 보면, DOF = 100(100-1 = 99에 가까움)의 경우, 도움이 되지 않으며, 테이블은 t = 3.39까지만 올라갑니다.
그림 2. t 값 표.
이러한 단점을 극복하기 위해, 주어진 DOF로 주어진 t에 대한 p 값을 계산하는 Excel® 소프트웨어 도구를 개발했습니다. 이 경우 t = 5.24(셀 B2에 입력) 및 DOF = 99(셀 C2)에서 p 값은 9.708 x 10-7(셀 F3)입니다. 그림 3 참조. p 값의 해석은 귀무 가설을 기각하면 약 1/100만 번만 틀릴 것이라는 것입니다(9.708 x 10-7는 대략10-6).
그림 3. t 및 p 값을 계산하기 위한 Excel® 스프레드시트의 출력.
Excel® 스프레드시트는 p 값에 대한 t 값과 DOF 수를 계산할 수도 있습니다. 따라서, p = 9.708 x 10-7 (셀 B7) 및 DOF = 99(셀 C7)를 삽입하면 그림 3과 같이 t = 5.24(셀 F7)가 됩니다. 참고: Excel®은 셀 B7을 0.000001로 반올림합니다.
이 스프레드시트의 사본을 원하시면 저에게 rlasky@indium.com으로 이메일을 보내주십시오.
감사합니다,
론 박사
Connect with Indium.
Read our latest posts!