SMT 데이터 수집에서 통계적으로 중요한 것과 실질적으로 중요한 것의 비교여러분,
이송 효율(TE)은 솔더 페이스트 품질의 주요 결정 요소라고 귀사가 결정했다고 가정하죠. 이송 효율은 솔더 페이스트 증착 부피를 스텐실 구멍 부피로 나눈 비율입니다. 여러분은 TE가 중요한 결정 요소라는 것에 동의하지만, 한편으론, 솔더 페이스트에 대한 최근 평가를 보면 약간 곤란한 처지에 있게 됩니다. 10개 중 2개의 페이스트는 최고 점을 향해 분투하여 TE가 결정 요소인 것처럼 보입니다. 페이스트 A는 TE가 99.5%이고 페이스트 B는 TE가 99%입니다. 그래서 관리자들은 페이스트 A를 원하지만 여러분은 페이스트 A가 정지 대응이 빈약하여 꺼려합니다. 이것이 15분 이상 동안 스텐실에 남아 있게 되면, 첫 프린트는 버려야 합니다. 이런 취약점이 3교대 조업에서 30분 정도의 손실 생산을 초래할 수 있습니다.
그러나, TE 시험 결과에 따르면, 페이스트 A의 TE는 페이스트 B보다 통계적으로 보면 훨씬 더 양호했습니다. 여러분은 이 상황을 생각하고, 99.5%와 99%는 막상막하이므로 별 의미가 없다고 여깁니다.
통계 교과서를 다시 꺼내 가설 시험을 검토해 보세요. 그럼, 샘플 크기가 매우 큰 경우, 더욱 더 가깝게 되는 평균값들이 통계적으로는 상당히 다를 수 있습니다.
데이터에 따르면, 페이스트 A는 평균값이 99.5%이고 표준 편차는 10%인 반면에 페이스트 B는 평균값이 99%이며 또한 표준 편차는 10%입니다. 샘플 크기는 각각 10,000개 입니다. 분석에서 이렇게 큰 샘플 크기는 중요합니다. 평균값 표준 오류(SEM)는 가설 시험에서 평균값들을 비교하기 위해 사용합니다. SEM은 표준 편차 나누기 샘플 크기 (n)의 제곱근으로 정의됩니다:
따라서, 샘플 크기가 증가함에 따라 SEM이 작아지는데, 즉 통계학 용어로 “더욱 타이트”해집니다. 매우 큰 샘플 크기인 경우, 이런 타이트함으로 더욱 더 가까워지는 중간갑들을 통계적으로 구분할 수 있습니다. 이런 상황은 샘플 크기가 100개 미만인 경우는 문제가 안됩니다. 그런데, 문제는 오늘날의 현대식 솔더 페이스트 부피 검사 시스템으로는 1000개 이상의 샘플 크기가 보통이라는 것입니다.
그림 1을 보면 TE가 99.5%이고 99.0%이며 샘플 크기 100인 샘플들의 평균값 기대 샘플링 분포가 있는데, 둘 모두 표준 편차가 10%입니다. 눈으로 보는 경우, 많은 차이는 보지 못합니다. 그러나, 평균값과 표준 편차가 같고 샘플 크기가 10,000인 경우, 평균값의 샘플링 분포는 그림 2에서 보듯, 확연히 다릅니다.
그럼에도 불구하고 실제로는 그림 1과 2에서 보듯, 결과에 차이가 없다는 것입니다. 아주 작은 평균값 차이(0.5%)는 샘플 크기가 10,000인 경우 통계학적으로 중요할 수 있지만, 실질적으로는 중요할까요? 생산 현장에서 이런 작은 차이가 정말로 중요할까요? 거의 그렇지 않죠
Figure 1. Sampling Distribution of the Mean for a Sample Size of 100.
그림 2 샘플 크기 10,000의 평균값 샘플링 분포.
따라서, 큰 샘플 크기인 경우, 차이가 실질적인지 의문을 제기해야 합니다. TE의 경우, 제 생각에는 0.5% 차이는 실질적으로 중요하지 않다고 확신할 수 있다고 봅니다. 그러나, 차이가 2%나 5%인 경우는 어떻게 할까요? 두 말할 것도 없이, 차이가 어떤 수준에서 중요한지 알기 위해 실험을 해야 합니다.
상기에서 논한 사례를 볼 때, 저는 99.0% TE와 양호한 정지 대응이 있는 페이스트를 더 선호하게 됩니다.
감사합니다,
론박사
Connect with Indium.
Read our latest posts!