통계적으로 중요한 경우 메트릭의 실제적 중요성에서 차이가 있나요?
여러분,
현대 영상 기기의 출현으로, 이제 수 천의 SMT 솔더 페이스트 스텐실 프린트 전달 효율(TE)을 측정할 수 있어요. 이 상황은 통계적 중요성이 종종 무의미한 개념을 만들죠. 제가 예를 들어 설명해 볼께요.
30년 또는 그 전에 누군가 솔더 페이스트 1에 대한 25개 프린트의 TE를 측정했고 표준 편차 10%로 평균 90%를 얻었다고 가정해 봅시다. 솔더 페이스트 2는, 또한 25개 프린트로, 표준 편차 15%와 95%의 TE 평균을 나타냈어요. Minitab® 같은 소프트웨어를 사용하면, 95 % 신뢰 수준에서, 이러한 두 세트의 데이터는 크게 통계적으로 차이가 없음을 나타내기가 쉬워요. 이러한 상황은 평균의 신뢰 구간(CIM)을 플로팅하여 시각적으로 쉽게 볼 수 있어요. 두 개는 도표 1에서 보여진 경우가 아닌, 신뢰 구간이 중첩되지 않는 경우에만 통계적으로 달라요.
솔더 페이스트 1에 대한 TE 신뢰 구간
솔더 페이스트 2에 대한 TE 신뢰 구간
도표 1. CIM 중첩 때문에 평균은 통계적으로 현저하게 다르지는 않아요 ysl outlet
오늘, 실험은 5,000개 프린트로 실행하는 것이 될 것 같아요. 이 경우에서, 솔더 페이스트 1은 표준 편차 10%으로 94.5%의 평균 TE를 갖고 솔더 페이스트 2는 15%의 표준 편차와 95%의 평균을 갖는다고 가정해 보죠. 심지어 단 0.5% 만의 이 작은 차이로도, 차이는 통계적으로 중요해요. 이 발견은 도표 2에서 보여진 바와 같이 CIM 플로팅에 의해서 지원되요. 그것들은 중첩되지 않아요. 이 극적인 변화에 대한 이유는 평균의 표준 오류 (SEM)가 표본 크기의 제곱근의 1로 되기 때문이죠. 표본의 크기가 커질 때, SEM은 작아지고 CIM은 빽빽해져요.
솔더 페이스트 1에 대한 TE 신뢰 구간
평균 = 94.5
솔더 페이스트 2에 대한 TE 신뢰 구간
평균 = 95
도표 2. 5,000의 표본 크기로, 심지어 단 0.5%의 평균 차이가 통계적으로 중요해요. ysl outlet
이것은 의문을 야기하는데, 그 차이는 의미가 있는가요? 아마 아닐꺼에요. 충분히 큰 표본 크기에서 차이는 통계적으로 중요하게 될 거에요. 이러한 경우에서, 우리는 자신에게 질문할 필요가 있어요, “그것이 실제적으로 중요한가?” 오직 우리만 “실제적으로 중요한” 것의 의미를 정의할 수 있어요. 저는 대부분 0.5 %의 차이가 실질적으로 중요하지 않다는 것에 동의하리라고 생각해요. 이 상황은 특히 솔더 페이스트 1이 솔더 페이스트 2보다 훨씬 나은 다른 특성을 가졌다면 참이 될 수 있어요.
그래서, 항상 자신에게 질문하죠, “차이가 통계적으로 중요하다면, 그것은 또한 실제적으로 중요한가?”
감사합니다,
론 박사
Connect with Indium.
Read our latest posts!