Ir al contenido principal

Cómo representar un conjunto de datos con la ayuda de Excel: el diagrama de barras

Terminología estadística

En primer lugar, para que el lector se familiarice con la terminología estadística, recordemos algunos conceptos básicos:

-        Variable aleatoria: es una variable que toma valores al azar.

-        Variable aleatoria discreta: es una variable aleatoria que puede tomar un número finito o numerablemente infinito de valores discretos.

Por ejemplo:
-        El número de clientes que llega a una farmacia en un lapso de 10 minutos.
-        El número de estudiantes de un colegio que llega tarde un día cualquiera.
-        El número de ciudadanos de un país que votaría por cierto candidato.

-        Variable aleatoria continua: es una variable aleatoria que puede tomar infinitos valores de números reales.

Por ejemplo:
-        El diámetro de una tapa para un frasco.
-        El peso de una bolsa de cemento.
-        El volumen de agua de una botella.

-        Frecuencia: es la cantidad de veces que se repite un dato, o la cantidad de datos que hay en un determinado rango.

-        Rango o amplitud: es la diferencia entre el mayor y el menor de los datos de una muestra o población.

Diagrama de barras


Si se cuenta con una muestra de datos que corresponden a una variable aleatoria discreta, cuyo rango o amplitud es pequeño (menor de 20), se puede construir una tabla de distribución de frecuencias. En esta tabla se indica la frecuencia con que se presenta cada uno de los datos.

Por ejemplo, considérense los siguientes 20 datos:


Al hacer click en el icono de función (fx) de Excel, se muestra un cuadro de diálogo con todas sus funciones. La función FRECUENCIA calcula las frecuencias (fi) con que se repiten los valores (xi) de un conjunto de datos y las devuelve en una matriz vertical de números.

Seleccionando las celdas (en forma vertical) donde se desea que aparezcan las frecuencias, y escogiendo luego la función FRECUENCIA, aparece un cuadro de diálogo donde Excel pide:
  •        Datos: aquí se ingresa el rango de celdas donde están los datos.
  •        Grupos: aquí se ingresa el rango de celdas donde están los valores xi.


Generalmente no se conocen todos los valores xi del conjunto de datos; pero como tales valores son discretos, es posible determinarlos hallando previamente el menor y el mayor de todos los datos, empleando las funciones de Excel, MIN y MAX, respectivamente.

Para que la fórmula de Frecuencia se convierta en matricial, se debe seleccionar todas las celdas donde irán las frecuencias y luego digitar control–shift–enter , cuando el cursor esté al final de la fórmula. De esta manera se obtiene la siguiente tabla:


Para construir el diagrama de barras correspondiente basta con recurrir al asistente de gráficos de Excel. Así, se obtiene:

Si se cuenta con una muestra de datos que corresponden a una variable aleatoria continua, o a una variable aleatoria discreta cuyo rango o amplitud sea muy grande, será necesario agrupar los datos en intervalos, pues un diagrama de barras tendría demasiadas barras y no mostraría cómo se distribuyen los datos, como se ve en el siguiente gráfico.




Comentarios

Entradas más populares de este blog

Interpretación de histogramas

Los histogramas nos pueden brindar mucha información que en las empresas ni se imaginan. Para una persona que conozca un proceso cualquiera, la forma que tiene  un histograma construido a partir de una muestra de datos extraídos de dicho proceso, le indicará qué podría estar ocurriendo con su proceso. A continuación se muestran los distintos tipos de histogramas que se podrían encontrar, con una interpretación de lo que probablemente esté ocurriendo. Histograma general : la media del histograma está en el centro del rango de datos. La frecuencia es mayor en el centro y disminuye gradualmente hacia los extremos, ajustándose a una distribución normal. Se presenta en casi todos los casos en que se representa una medida importante en un proceso productivo. Histograma con sesgo positivo o negativo : tiene forma asimétrica. La media del histograma está a la izquierda (o a la derecha) y la frecuencia disminuye lentamente hacia la derecha (o hacia la izquierda). Se presen

Gráficos o cartas de control

El 16 de mayo de 1924, Walter A. Shewhart, un físico estadounidense, entregó un informe de una página a su jefe en Bell Technologies , destinado a cambiar la historia de la calidad. En él, un breve texto acompañaba a un gráfico, hoy conocido como gráfico o carta de control. Actualmente, pese a que sus gráficos de control siguen siendo útiles, muchos los emplean de manera incorrecta por el desconocimiento que tienen de los fundamentos estadísticos que los sustentan. Los gráficos de control nos permiten visualizar cómo va cambiando la variabilidad de una determinada medida (por ejemplo, el peso del agua embotellada que va saliendo de un proceso de producción), a lo largo del tiempo. Un gráfico de control está conformado por una línea central, que suele medir un promedio; dos límites de control, uno por encima y otro por debajo de la línea central; y una serie de valores característicos registrados en el gráfico que representan el estado de una medida de un proceso a lo largo de

La distribución normal (la campana de Gauss)

La curva normal o campana de Gauss Todas las medidas tomadas en cualquier proceso productivo tienen una distribución simétrica en forma de campana, si es que el proceso productivo está bajo control, es decir, si todo está funcionando dentro de lo establecido. Ejemplo de medidas tomadas en un proceso productivo: El peso de las bolsas que se llenan con azúcar con una máquina automática. El diámetro de los pistones que se elaboran en un taller. El volumen de las botellas que se llenan con cerveza con una máquina automática. La temperatura de un horno de cocción en un proceso de fabricación de harina de pescado. El voltaje que llegan a las viviendas en una ciudad. Estas medidas suelen tener una distribución simétrica en forma de campana debido a que, al haber un control sobre estas, la gran mayoría resultan muy cercanas al valor nominal establecido, y muy pocas resultan más lejanas a dicho valor. ¿Y cómo es esa distribución simétrica en forma de campana? Imagínense q