Datos estadísticamente significativos versus prácticamente significativos en recolección de datos SMT.
Amigos,
Supongamos que su empresa ha decidido que la eficiencia de transferencia (ET) es la estadística clave para determinar la calidad de la pasta de soldadura. La eficiencia de transferencia es la relación del volumen del depósito de pasta de soldadura dividido por el volumen de la abertura del esténcil. Si bien aceptan que la ET es una estadística importante, están un poco preocupados con los resultados recientes en una evaluación de pasta de soldadura. Dos de cada 10 pastas están luchando por el primer puesto y parece que la ET será la estadística decisiva. La pasta A tenía una ET del 99,5% y la pasta B tenía una ET del 99%. Por lo tanto, la administración quiere usar la pasta A. Están preocupados porque la pasta A tiene una respuesta pobre a la pausa. Si se deja en la plantilla durante 15 minutos o más, la primera impresión debe descartarse. Esta debilidad puede resultar en aproximadamente 30 minutos de pérdida de tiempo de producción en una operación de 3 turnos.
Sin embargo, los resultados de la prueba de ET mostraron que la ET de la pasta A fue estadísticamente significativamente mejor que la pasta B. Piensan en esta situación y algo no tiene sentido... 99,5% y 99% están bastante cerca.
Desempolvan su libro de texto de estadística y revisan las pruebas de hipótesis. Entonces encuentran esto, con tamaños de muestra muy grandes, medias que se encuentran más cerca estadísticamente pueden ser significativamente diferentes.
Los datos muestran que la pasta A tiene una media del 99,5% y una desviación estándar del 10%, mientras que la pasta B tiene una media del 99% y también una desviación estándar del 10%. El tamaño de muestra fueron de 10.000 muestras cada uno. Estos tamaños de muestra grandes son importantes en el análisis. El error estándar de la media (SEM) se utiliza para comparar medias en una prueba de hipótesis. SEM se define como la desviación estándar (s) dividida por la raíz cuadrada del tamaño de la muestra (n):
Entonces, a medida que aumenta el tamaño de la muestra, el SEM se vuelve más pequeño o en la jerga estadística "más ajustado". Con tamaños de muestra muy grandes, esta estanqueidad permite la capacidad de distinguir estadísticamente entre medias que están cada vez más cercanas. Esta situación no era una preocupación con tamaños de muestra inferiores a 100;, sin embargo, con los modernos sistemas de escaneo de volumen de pasta de soldadura de hoy en día, los tamaños de muestra superiores a 1000 son comunes.
La Figura 1 muestra la distribución de muestreo esperada de la media para muestras con un TE de 99,5% y 99,0% y un tamaño de muestra de 100, ambos tienen una desviación estándar de 10%. Tenga en cuenta que a su vista no ve mucha diferencia. Sin embargo, con las medias y las desviaciones estándar iguales y tamaños de muestra de 10.000, las distribuciones de muestreo de la media son claramente diferentes en la Figura 2.
Sin embargo, la realidad es que no hay diferencia en los resultados en las Figuras 1 y 2. La pequeña diferencia en las medias (0,5%) puede ser estadísticamente significativa con un tamaño de muestra de 10.000, pero ¿es prácticamente significativa? ¿Importaría realmente esta pequeña diferencia en un entorno de producción? Casi seguro que no.
Figura 1 Distribución de muestreo de la media para un tamaño de muestra de 100
Figura 2 Distribución de muestreo de la media para un tamaño de muestra de 10.000.
Entonces, con tamaños de muestra grandes, debemos preguntarnos si la diferencia es práctica. Para la ET, creo que podemos estar seguros de que una diferencia de 0,5% no es prácticamente significativa. Pero, ¿y si la diferencia fuera del 2% o 5%? Claramente, se deben realizar experimentos para determinar en qué nivel es significativa una diferencia.
En el caso discutido anteriormente, preferiría mucho la pasta que tiene un 99,0% de ET y una buena respuesta a la pausa.
Ánimos,
Dr. Ron
Connect with Indium.
Read our latest posts!