Ir al contenido principal

Muestra y población

POBLACIÓN O UNIVERSO

Es el conjunto de datos o elementos cuyas propiedades se van a analizar. Cuando se quiere realizar una investigación estadística, debe definirse cuidadosamente el universo. Si se quiere investigar, por ejemplo, qué proporción de la población de Piura fuma cigarrillos, debe definirse claramente el universo, diciendo quiénes lo conforman. No sería correcto decir que lo conforman los adultos, pues este término no está claramente definido. Podría definirse correctamente el universo diciendo, por ejemplo, que lo conforman aquellos que tienen 18 años cumplidos. En este ejemplo el universo está conformado por personas, o mejor dicho, por un atributo de dichas personas; pero el universo podría estar conformado por atributos o mediciones de personas, objetos o animales.

MUESTRA

Es un conjunto de datos seleccionados de una población, de tal forma que refleje las características de esta. Se dice entonces que la muestra es representativa de la población.

A pesar de que solo se debe llamar muestra a un conjunto de datos representativos de la población, se suele clasificar las muestras en: probabilísticas y no probabilísticas. Las probabilísticas son representativas de la población; las no probabilísticas no son representativas de la población.

Se dice que una muestra es probabilística cuando cada elemento de la población tiene una probabilidad conocida de ser seleccionado en la muestra. La muestra es no probabilística cuando sus elementos se eligen con base en el juicio o criterio del investigador. Esto puede dar lugar a una “muestra” que no sea representativa de la población de la cual fue extraída. Generalmente, cuando se hace una investigación, se extraen muestras probabilísticas, por razones evidentes.

Una muestra probabilística puede ser: 

- Muestra aleatoria simple.

- Muestra estratificada.

- Muestra por conglomerados.

Muestra aleatoria simple

Se denomina muestra aleatoria simple a aquella que es seleccionada de tal forma que cada elemento de la población tiene la misma probabilidad de ser seleccionado. Un buen método para conseguir esto consiste en enumerar previamente todos los elementos que conforman el universo, y, empleando números aleatorios, seleccionar la muestra del tamaño deseado.

Si la población es de gran tamaño, puede resultar muy difícil tener un listado completo de la población, pues se necesitaría mucho tiempo y/o dinero para conseguirlo. Conviene en este caso dividir la población en estratos, y tratar a cada uno de estos como una población independiente.

Muestra estratificada

Se denomina muestra estratificada a aquella que se obtiene dividiendo la población en estratos, para luego seleccionar “submuestras” de cada estrato.

Muestra por conglomerados

Se denomina muestra por conglomerados a aquella que se obtiene estratificando la población, para luego tomar todos o algunos elementos de algunos estratos, seleccionados aleatoriamente. A dichos estratos se les denomina conglomerados.

Cabe aclarar que el objetivo de estratificar la población para obtener muestras de los estratos es tratar de conseguir una muestra que sea lo más aleatoria posible, es decir, que sea representativa de la población.

Comentarios

Entradas más populares de este blog

Interpretación de histogramas

Los histogramas nos pueden brindar mucha información que en las empresas ni se imaginan. Para una persona que conozca un proceso cualquiera, la forma que tiene  un histograma construido a partir de una muestra de datos extraídos de dicho proceso, le indicará qué podría estar ocurriendo con su proceso. A continuación se muestran los distintos tipos de histogramas que se podrían encontrar, con una interpretación de lo que probablemente esté ocurriendo. Histograma general : la media del histograma está en el centro del rango de datos. La frecuencia es mayor en el centro y disminuye gradualmente hacia los extremos, ajustándose a una distribución normal. Se presenta en casi todos los casos en que se representa una medida importante en un proceso productivo. Histograma con sesgo positivo o negativo : tiene forma asimétrica. La media del histograma está a la izquierda (o a la derecha) y la frecuencia disminuye lentamente hacia la derecha (o hacia la izquierda). Se presen

Gráficos o cartas de control

El 16 de mayo de 1924, Walter A. Shewhart, un físico estadounidense, entregó un informe de una página a su jefe en Bell Technologies , destinado a cambiar la historia de la calidad. En él, un breve texto acompañaba a un gráfico, hoy conocido como gráfico o carta de control. Actualmente, pese a que sus gráficos de control siguen siendo útiles, muchos los emplean de manera incorrecta por el desconocimiento que tienen de los fundamentos estadísticos que los sustentan. Los gráficos de control nos permiten visualizar cómo va cambiando la variabilidad de una determinada medida (por ejemplo, el peso del agua embotellada que va saliendo de un proceso de producción), a lo largo del tiempo. Un gráfico de control está conformado por una línea central, que suele medir un promedio; dos límites de control, uno por encima y otro por debajo de la línea central; y una serie de valores característicos registrados en el gráfico que representan el estado de una medida de un proceso a lo largo de

La distribución normal (la campana de Gauss)

La curva normal o campana de Gauss Todas las medidas tomadas en cualquier proceso productivo tienen una distribución simétrica en forma de campana, si es que el proceso productivo está bajo control, es decir, si todo está funcionando dentro de lo establecido. Ejemplo de medidas tomadas en un proceso productivo: El peso de las bolsas que se llenan con azúcar con una máquina automática. El diámetro de los pistones que se elaboran en un taller. El volumen de las botellas que se llenan con cerveza con una máquina automática. La temperatura de un horno de cocción en un proceso de fabricación de harina de pescado. El voltaje que llegan a las viviendas en una ciudad. Estas medidas suelen tener una distribución simétrica en forma de campana debido a que, al haber un control sobre estas, la gran mayoría resultan muy cercanas al valor nominal establecido, y muy pocas resultan más lejanas a dicho valor. ¿Y cómo es esa distribución simétrica en forma de campana? Imagínense q