Ir al contenido principal

Entradas

Mostrando las entradas de febrero, 2020

El teorema del límite central

Dicen algunos estadísticos que es el teorema más importante de la Estadística. Lo cierto es que gracias a él, la gestión de la calidad dio un paso muy importante en la mejora de procesos. Y es que, el Gráfico de Control de Medias, una de las herramientas más poderosas del Control Estadístico de Procesos, se basa en este teorema. Conceptos previos: Media de una población: es la media aritmética de un conjunto de datos que conforman una población ( N ). Media de una muestra: es la media aritmética de un conjunto de datos que conforman una muestra ( n ). Generalmente son objetos de estudio poblaciones muy grandes, de tamaño N , y resulta muy difícil calcular la media de la población, pues se requeriría mucho tiempo y dinero. Entonces se recurre a una muestra, de tamaño n , para estimar la media de la población. Es evidente que, mientras más grande sea la muestra, la media que se calcule estará más próxima a la media de la población; pero como ya se dijo ante

Cómo agrupar y representar un conjunto de datos con la ayuda de Excel: el histograma

Terminología estadística En primer lugar, para que el lector se familiarice con la terminología estadística, recordemos algunos conceptos básicos: -          Variable aleatoria : es una variable que toma valores al azar. -          Variable aleatoria discreta : es una variable aleatoria que puede tomar un número finito o numerablemente infinito de valores discretos. Por ejemplo: -          El número de clientes que llega a una farmacia en un lapso de 10 minutos. -          El número de estudiantes de un colegio que llega tarde un día cualquiera. -          El número de ciudadanos de un país que votaría por cierto candidato. -          Variable aleatoria continua : es una variable aleatoria que puede tomar infinitos valores de números reales. Por ejemplo: -          El diámetro de una tapa para un frasco. -          El peso de una bolsa de cemento. -          El volumen de agua de una botella. -           Frecuencia : es la cantidad de veces que se

Cómo representar un conjunto de datos con la ayuda de Excel: el diagrama de barras

Terminología estadística En primer lugar, para que el lector se familiarice con la terminología estadística, recordemos algunos conceptos básicos: -         Variable aleatoria : es una variable que toma valores al azar. -         Variable aleatoria discreta : es una variable aleatoria que puede tomar un número finito o numerablemente infinito de valores discretos. Por ejemplo: -         El número de clientes que llega a una farmacia en un lapso de 10 minutos. -         El número de estudiantes de un colegio que llega tarde un día cualquiera. -         El número de ciudadanos de un país que votaría por cierto candidato. -         Variable aleatoria continua : es una variable aleatoria que puede tomar infinitos valores de números reales. Por ejemplo: -         El diámetro de una tapa para un frasco. -         El peso de una bolsa de cemento. -         El volumen de agua de una botella. -          Frecuencia : es la cantidad de veces que se repite u

La distribución normal (la campana de Gauss)

La curva normal o campana de Gauss Todas las medidas tomadas en cualquier proceso productivo tienen una distribución simétrica en forma de campana, si es que el proceso productivo está bajo control, es decir, si todo está funcionando dentro de lo establecido. Ejemplo de medidas tomadas en un proceso productivo: El peso de las bolsas que se llenan con azúcar con una máquina automática. El diámetro de los pistones que se elaboran en un taller. El volumen de las botellas que se llenan con cerveza con una máquina automática. La temperatura de un horno de cocción en un proceso de fabricación de harina de pescado. El voltaje que llegan a las viviendas en una ciudad. Estas medidas suelen tener una distribución simétrica en forma de campana debido a que, al haber un control sobre estas, la gran mayoría resultan muy cercanas al valor nominal establecido, y muy pocas resultan más lejanas a dicho valor. ¿Y cómo es esa distribución simétrica en forma de campana? Imagínense q

¿Son confiables las encuestas de opinión?

En estos últimos años, en el Perú, la imagen de las encuestas ha sufrido un deterioro. Se dice que algunas empresas encuestadoras se venden al mejor postor o simplemente favorecen los intereses de sus dueños. Entonces tenemos que reformular la pregunta: ¿ SON CONFIABLES LAS ENCUESTADORAS ? Es probable que algunas empresas encuestadoras manipulen los resultados de sus encuestas, cambiando algunos porcentajes dentro del margen de error. Por ejemplo, si una encuesta ha sido diseñada para que tenga un margen de error del ±5%, y un candidato tiene el 15% de los votos de una muestra de votantes, entonces se puede afirmar, con una confiabilidad del 95%, que dicho candidato tiene entre el 10% y el 20% de los votos de la población electoral. Si la empresa encuestadora quisiera favorecer a este candidato, podría publicar que obtuvo el 19% o 20%, sin el riesgo de cometer un error grave que lo desprestigie. Esta manipulación puede ser mayor aún cuando la encuesta presenta resultados por

Las encuestas de opinión y la ficha técnica

Las encuestas de opinión se realizan, en general, para estimar qué porcentaje ( p ) de miembros de una población tienen una característica, por ejemplo: que opinan de una manera, o que están de acuerdo con cierta política, o que piensan votar por un determinado candidato, etc. Cuando la población de interés es muy grande, es imposible encuestar a todos sus miembros, y se debe recurrir a una muestra que la represente bien. Para determinar de qué tamaño debe ser la muestra, de tal manera que sea representativa de la población, es necesario saber: de qué tamaño es la población, el máximo error muestral que se desea cometer, y la confiabilidad. La ficha técnica: En la ficha técnica de una encuesta se precisan, entre otros, los siguientes datos: Tamaño de la población ( N ): Es el número de elementos (personas, familias, etc.) que conforman la población de interés. Tamaño de la muestra ( n ): Es el número de elementos que se extrae aleatoriamente de la población. Error mues

Resultados de las votaciones para el Congreso 2020: acertó IPSOS

La ONPE ya publicó (hoy día, 3 de febrero de 2020) los resultados porcentuales de los partidos políticos que participaron en la recientes elecciones congresales 2020. Como era de esperarse, la encuesta que realizó Ipsos, a Boca de urna , acertó con los resultados finales que ha publicado la ONPE, considerando el margen del 2% que anunció. En la siguiente tabla se puede ver ambos resultados y la diferencia entre el resultado pronosticado a boca de urna y el resultado final. A esta diferencia se le llama "Error muestral". Como se ve, en todos los casos el error muestral fue menor del 2%. Asimismo, Ipsos, con sus resultados del Conteo rápido , también acertó con los resultados finales que ha publicado la ONPE, esta vez por un margen mucho más pequeño. Para estos resultados Ipsos anunció un margen de error del 1% En la siguiente tabla se puede ver ambos resultados y la diferencia entre el resultado pronosticado a boca de urna y el resultado final. En todos los ca

Cómo determinar el tamaño de una muestra

Defina bien su objetivo Para determinar el tamaño de una muestra, en primer lugar se debe tener claro cuál es el objetivo, es decir, para qué se quiere obtener una muestra de la población. Generalmente hay dos posibles objetivos: estimar la media de una población, o estimar una proporción de una población. Algunas veces, por ejemplo, en las encuestas de estudios de mercado, se tienen ambos objetivos. Objetivo 1: Muestreo para estimar la media de una población Si se desea estimar una media poblacional, por ejemplo, el peso promedio de las bolsas de cemento producidas en un  mes , o el volumen promedio de las botellas de agua producidas en una semana, o la edad promedio de los alumnos universitarios en Lima, el tamaño de la muestra se puede determinar a partir de la siguiente fórmula:   ...  Fórmula 1 En esta Fórmula 1: - N =  tamaño de la población. - z   =  valor estandarizado que corresponde a la confiabilidad que se desee . Para una confiabilidad           del 95%