Ir al contenido principal

El teorema del límite central

Dicen algunos estadísticos que es el teorema más importante de la Estadística. Lo cierto es que gracias a él, la gestión de la calidad dio un paso muy importante en la mejora de procesos. Y es que, el Gráfico de Control de Medias, una de las herramientas más poderosas del Control Estadístico de Procesos, se basa en este teorema.

Conceptos previos:

Media de una población: es la media aritmética de un conjunto de datos que conforman una población (N).


Media de una muestra: es la media aritmética de un conjunto de datos que conforman una muestra (n).

Generalmente son objetos de estudio poblaciones muy grandes, de tamaño N, y resulta muy difícil calcular la media de la población, pues se requeriría mucho tiempo y dinero. Entonces se recurre a una muestra, de tamaño n, para estimar la media de la población.

Es evidente que, mientras más grande sea la muestra, la media que se calcule estará más próxima a la media de la población; pero como ya se dijo antes, resultará más antieconómica y requerirá de más tiempo.

El teorema del límite Central

Si se extraen varias muestras de tamaño n de cualquier población (no necesariamente normal) con media m y desviación estándar s, las medias de estas muestras (medias muestrales) tendrán una distribución aproximadamente normal con media m y desviación estándar s /√n, si n es grande (mayor o igual que 50). Si la población tiene distribución normal, la media muestral tendrá también distribución normal, aunque n sea pequeño (menor que 50).

Si la población no es normal; pero no dista mucho de serlo, como en la figura 1, no hace falta que las muestras sean tan grandes para que se cumpla el teorema del límite central. Con n = 10 o 20 podría ser suficiente

Puede ilustrarse este teorema mediante el siguiente ejemplo: se seleccionan aleatoriamente 100 muestras, cada conformada por 50 bolsas de azúcar de la producción de una fábrica, y se calcula la media los pesos en cada una de las muestras. Las 100 medias calculadas se agrupan en clases y se traza un histograma que las representa. Este histograma tendrá una forma muy aproximada a una curva normal. Si se supiera el promedio y la desviación estándar de los pesos de todas las bolsas de azúcar que se han producido (parámetros poblacionales), se estaría verificando también que la media de las medias de las 100 muestras casi coincide con la media poblacional, y que la desviación estándar de la población, dividida entre √n, casi coincide con la desviación estándar de las medias.

En la Figura 1 se puede ver cómo se distribuye una misma población de datos, y cómo se distribuyen las medias de muestras grandes sacadas de esa población. Se aprecia que la amplitud de las medias es considerablemente menor que la amplitud de los datos de la población; mientras más grandes sean las muestras, más pequeña será la amplitud de las medias.
Figura 1
En la figura 2 se puede ver cómo se distribuyen las medias de varias muestras obtenidas de una misma población, para distintos tamaños de muestras.


Figura 2
Las flechas que se han trazado en el eje horizontal representan el rango de valores que podría tomar una media de una muestra, de acuerdo al tamaño de muestra elegido. Como se ve en la Figura 2, este rango es cada vez más estrecho a medida que crece el tamaño de la muestra. Nótese que al pasar de una muestra de tamaño 10 a una muestra de tamaño 50, el rango disminuye considerablemente. En cambio, al aumentar por encima de 50, la reducción del rango no es tan notable, salvo que la muestra sea considerablemente grande.

Comentarios

Entradas más populares de este blog

Interpretación de histogramas

Los histogramas nos pueden brindar mucha información que en las empresas ni se imaginan. Para una persona que conozca un proceso cualquiera, la forma que tiene  un histograma construido a partir de una muestra de datos extraídos de dicho proceso, le indicará qué podría estar ocurriendo con su proceso. A continuación se muestran los distintos tipos de histogramas que se podrían encontrar, con una interpretación de lo que probablemente esté ocurriendo. Histograma general : la media del histograma está en el centro del rango de datos. La frecuencia es mayor en el centro y disminuye gradualmente hacia los extremos, ajustándose a una distribución normal. Se presenta en casi todos los casos en que se representa una medida importante en un proceso productivo. Histograma con sesgo positivo o negativo : tiene forma asimétrica. La media del histograma está a la izquierda (o a la derecha) y la frecuencia disminuye lentamente hacia la derecha (o hacia la izquierda). Se presen

Gráficos o cartas de control

El 16 de mayo de 1924, Walter A. Shewhart, un físico estadounidense, entregó un informe de una página a su jefe en Bell Technologies , destinado a cambiar la historia de la calidad. En él, un breve texto acompañaba a un gráfico, hoy conocido como gráfico o carta de control. Actualmente, pese a que sus gráficos de control siguen siendo útiles, muchos los emplean de manera incorrecta por el desconocimiento que tienen de los fundamentos estadísticos que los sustentan. Los gráficos de control nos permiten visualizar cómo va cambiando la variabilidad de una determinada medida (por ejemplo, el peso del agua embotellada que va saliendo de un proceso de producción), a lo largo del tiempo. Un gráfico de control está conformado por una línea central, que suele medir un promedio; dos límites de control, uno por encima y otro por debajo de la línea central; y una serie de valores característicos registrados en el gráfico que representan el estado de una medida de un proceso a lo largo de

La distribución normal (la campana de Gauss)

La curva normal o campana de Gauss Todas las medidas tomadas en cualquier proceso productivo tienen una distribución simétrica en forma de campana, si es que el proceso productivo está bajo control, es decir, si todo está funcionando dentro de lo establecido. Ejemplo de medidas tomadas en un proceso productivo: El peso de las bolsas que se llenan con azúcar con una máquina automática. El diámetro de los pistones que se elaboran en un taller. El volumen de las botellas que se llenan con cerveza con una máquina automática. La temperatura de un horno de cocción en un proceso de fabricación de harina de pescado. El voltaje que llegan a las viviendas en una ciudad. Estas medidas suelen tener una distribución simétrica en forma de campana debido a que, al haber un control sobre estas, la gran mayoría resultan muy cercanas al valor nominal establecido, y muy pocas resultan más lejanas a dicho valor. ¿Y cómo es esa distribución simétrica en forma de campana? Imagínense q