Análisis de varianza (ANOVA) con Excel

El análisis de varianza, o ANOVA, compara dos o más medias de distintas poblaciones. Para esto extrae una muestra de cada población y analiza qué tan dispersas están las medias de dichas muestras, es decir, qué tanto difieren entre sí.

Para que el análisis de varianza tenga validez se requiere que las poblaciones muestreadas sean normales y que las varianzas de dichas poblaciones sean iguales. Una estimación de esta varianza común, s ², que sería también una estimación de la varianza de todas las muestras, estará conformada por dos varianzas: la varianza entre las medias de las muestras y la varianza promedio dentro de las muestras.

Para entender la naturaleza del análisis de varianza, supóngase que se quiere averiguar si son iguales o no las medias de tres poblaciones: μ₁, μ₂ y μ₃. Para esto, se extrae una muestra de cada población, cuyas medidas se expresan en el eje horizontal de la Figura 1.

Figura 1. Muestras con medias muy diferentes

A simple vista se podría afirmar que μ₁, μ₂ y μ₃ son diferentes, pues las tres medias muestrales son muy diferentes (recuerde que no se conocen las medias poblacionales). Analíticamente, se podría llegar a la misma conclusión calculando la varianza que hay entre las medias de las muestras. Si esta varianza es grande, indicará que las medias muestrales difieren mucho; pero, ¿cómo determinar a partir de qué valor se puede afirmar que la varianza es grande? Una forma muy práctica de hacerlo es comparándola con la varianza promedio de los datos de las muestras. Así, si la varianza que hay entre las medias de las muestras es significativamente mayor que la varianza que hay dentro de las muestras, se puede afirmar que las medias poblacionales difieren significativamente.

Supóngase ahora que se quiere averiguar si las medias de las tres poblaciones representadas en la figura 2 son iguales o no.

Figura 2. Muestreos con medias diferentes

Se aprecia en la Figura 2 que las medias muestrales son diferentes; pero esta vez difieren menos. La varianza entre las medias muestrales es, en este caso, ligeramente mayor que la varianza promedio dentro de las muestras. Nuevamente se podrá afirmar que las medias poblacionales difieren significativamente.

Supóngase, finalmente, que se desea averiguar si las medias de las tres poblaciones representadas en la Figura 3 son iguales o no. Nuevamente se debe asumir que no conoce las medias poblacionales, aunque en la figura se aprecie que estos valores son iguales.

Figura 3. Muestreos con medias ligeramente diferentes

En esta última situación, la varianza entre las medias muestrales es menor que la varianza promedio dentro de las muestras, lo cual indica que las medias muestrales no difieren significativamente. Se concluye entonces que las medias poblacionales son iguales.

Ahora se entiende cómo un análisis de varianza permite probar si las medias de varias poblaciones son todas iguales o no son todas iguales.

Análisis de varianza de un factor

Se denomina análisis de varianza de un factor o unidireccional, al análisis que se hace cuando los factores externos se controlan mediante un diseño completamente aleatorio del experimento. Entonces, se considera que el único factor que actúa sobre las unidades experimentales son los tratamientos. En el ejemplo anterior de las distintas fórmulas nuevas de detergente que se aplican a distintos grupos de prendas de vestir, los tratamientos serán precisamente las distintas fórmulas del detergente.

Si se quiere comparar las medias de k poblaciones, se plantean las siguientes hipótesis:

H₀ : μ₁ = μ₂ = … = μ_k

H₁ : Al menos una media es diferente

Como ya se dijo antes, se va a comparar la varianza de las medias muestrales con la varianza promedio dentro de las muestras; pero la primera suele ser menor, pues las medias muestrales suelen estar más cercanas entre sí que los datos de las muestras entre sí. Para que ambas varianzas sean comparables, se multiplica la varianza de las medias muestrales por n, en virtud del teorema del límite central. A esta se le conoce como varianza explicada, porque explica qué parte de la varianza total es explicada por la acción de los tratamientos.

La varianza explicada es:

En esta expresión, al numerador se le conoce como suma de los cuadrados de los tratamientos (SST), y el denominador representa el número de grados de libertad. A este cociente también se le llama promedio de los cuadrados de los tratamientos (PPT).

La varianza promedio dentro de las muestras se conoce como varianza no explicada o error, pues se atribuye al azar. Esta varianza constituye otra estimación de la varianza de la población.

La varianza no explicada es:

En esta última expresión, al numerador se le conoce como suma de los cuadrados del error (SSE), y el denominador representa el número de grados de libertad. A este cociente también se le llama promedio de los cuadrados del error (PPE).

Para determinar si la varianza explicada o varianza de los tratamientos es mayor que la varianza no explicada o varianza del error, se hace la Prueba F de comparación de varianzas. Si ocurre esto, se podrá afirmar que la varianza de los tratamientos es muy grande, y por lo tanto se podrá afirmar que las medias de los tratamientos difieren significativamente.

Se plantean las siguientes hipótesis:

Se aceptará la hipótesis nula si:

Si se acepta esta hipótesis nula (H₀), se estaría aceptando que las medias de los tratamientos no difieren significativamente, es decir, que dichas medias son iguales.

Los valores que se calculan para el análisis de varianza suelen expresarse en una tabla, como se muestra a continuación.

Ejemplo 1:

Se quiere evaluar tres métodos de capacitación del personal de una fábrica. El jefe de capacitación selecciona 15 nuevos obreros y los distribuye aleatoriamente en los tres métodos. Una vez terminada la capacitación, los obreros comienzan a trabajar y se les anota la producción diaria de cada uno de ellos. ¿Hay diferencia de eficacia entre los tres métodos de capacitación?

En primer lugar, se plantean las siguientes hipótesis:

H₀ : μ₁ = μ₂ = μ₃

H₁ : Al menos una media es diferente

Luego se copia la tabla en Excel y se ingresa al menú Datos/Análisis de datos/Análisis de varianza de un factor. Excel muestra el cuadro de diálogo de la Figura 4. En este cuadro ya se han ingresado los datos del problema, que en la hoja de cálculo figuran entre las celdas A1 y E3.

Figura 4. Cuadro de diálogo

Aceptando los datos ingresados en el cuadro de diálogo, Excel presenta dos tablas: la primera es un resumen de los datos del problema, incluyendo medias y varianzas; y la segunda es la tabla ANOVA del problema, como se muestra a continuación:

La tabla ANOVA que presenta Excel tiene una columna más que la tabla ANOVA presentada anteriormente, con P = p-value = 0,3337; que representa la probabilidad de que se obtenga un valor de F mayor o igual que 1,2042. Lógicamente, si esta probabilidad es mayor que a; se aceptará H₀.

Resulta: F < F*; por lo tanto se acepta la hipótesis nula de igualdad de varianzas y se acepta también la hipótesis nula de igualdad de medias (H₀: μ₁ = μ₂ = μ₃).

Se puede afirmar entonces que los tres métodos de capacitación son igualmente eficientes.

Análisis de varianza de dos factores, sin interacción entre los factores

Se denomina análisis de varianza de dos factores o bidireccional, al análisis que se hace cuando los factores externos se controlan mediante un diseño aleatorizado por bloques. Se consideran dos factores que actúan sobre las unidades experimentales: los tratamientos y el factor externo que se desea eliminar mediante la formación de bloques.

Cabe la posibilidad de que estos dos factores interactúen uno sobre el otro. Por ejemplo, una fórmula del detergente que se va a experimentar puede actuar mejor o peor sobre determinados materiales de ropa. En este apartado no se va a considerar esta posibilidad de interacción entre los factores.

Ya que se están considerando dos factores que actúan sobre las unidades experimentales, se puede aprovechar esto para hacer simultáneamente dos investigaciones: comparar las medias de los k tratamientos y comparar las medias de los n bloques. Se pueden plantear entonces las siguientes hipótesis:

Para los tratamientos: H₀ : m₁ = m₂ = … = m_k

H₁ : Al menos una media es diferente

Para los bloques: H₀ : m₁ = m₂ = … = m_n

H₁ : Al menos una media es diferente

En este caso se considera la varianza explicada de los tratamientos y la varianza explicada de los bloques. La varianza explicada de los tratamientos s_ET² se calcula nuevamente con la expresión:

Al numerador se le conoce como suma de los cuadrados de los tratamientos (SST), y el denominador representa el número de grados de libertad. A este cociente también se le llama promedio de los cuadrados de los tratamientos (PPT).

La varianza explicada de los bloques s_EB² se calcula con una expresión similar. El número de bloques es n, y el número de datos en cada bloque es k. La varianza explicada de los bloques será:

Al numerador se le conoce como suma de los cuadrados de los bloques (SSB), y el denominador representa el número de grados de libertad. A este cociente también se le llama promedio de los cuadrados de los bloques (PPB).

La varianza no explicada o error es:

Para determinar si la varianza explicada o varianza de los tratamientos es mayor que la varianza no explicada o varianza del error, se hace la Prueba F de comparación de varianzas. Igualmente se podrá determinar si la varianza de los bloques es mayor que la varianza no explicada o varianza del error mediante otra Prueba F.

Se plantean entonces, independientemente, las hipótesis:

Se aceptará cada hipótesis nula si:

Si se acepta la primera hipótesis nula para los tratamientos (de igualdad de varianzas), se estaría aceptando que las medias de los tratamientos no difieren significativamente, es decir, que las medias de los tratamientos son iguales (H₀: m₁ = m₂ = … = m_k).

Igualmente, si se acepta la hipótesis nula para los bloques (de igualdad de varianzas), se estaría aceptando que las medias de los bloques no difieren significativamente, es decir, que las medias de los bloques son iguales (H₀: m₁ = m₂ = … = m_n).

Tabla ANOVA

Los valores que se calculan para este análisis de varianza suelen expresarse en una tabla, como se muestra en la siguiente tabla.

Ejemplo 2:

¿Se puede afirmar que las tres máquinas tienen la misma productividad?

En primer lugar, se plantean las siguientes hipótesis:

Para los tratamientos: H₀ : m₁ = m₂ = m₃

(máquinas) H₁ : Al menos una media es diferente

Para los bloques: H₀ : m₁ = m₂ = m₃ = m₄ = m₅

(niveles académicos) H₁ : Al menos una media es diferente

Ingresando al menú Datos /Análisis de datos /Análisis de varianza de dos factores con una sola muestra por grupo, Excel muestra el cuadro de diálogo de la siguiente figura. En este cuadro ya se han ingresado los datos del problema, que están entre las celdas B2 y D6.

Como se puede ver en esta tabla y en la tabla ANOVA que se muestra a continuación, lo que Excel denomina filas corresponde a los bloques (niveles académicos) y lo que denomina columnas corresponde a los tratamientos (tipos de máquina).

Para las filas resulta: F > F*; por lo tanto se rechaza la hipótesis nula (H₀: m₁ = m₂ = m₃).

Se puede afirmar entonces que las tres máquinas no tienen la misma productividad.

Para las columnas: F < F*; por lo tanto se acepta la hipótesis nula (H₀: m₁ = m₂ = m₃ = m₄ = m₅).

Se puede afirmar entonces que la productividad es la misma en los distintos niveles académicos de los empleados.

El lector debe llegar a estas mismas dos conclusiones interpretando los valores de Probabilidad (p-value), tal como se hizo en el apartado anterior.

Análisis de varianza de dos factores, con interacción entre los factores

Nuevamente se consideran dos factores que actúan sobre las unidades experimentales: los tratamientos y el factor externo que se desea eliminar mediante la formación de bloques; pero esta vez se considera la posibilidad de que haya interacción entre los factores.

Se podría dar el caso, por ejemplo, de que un grupo de empleados de cierto nivel académico sean más productivos que un grupo de otro nivel, cuando operan cierta máquina; pero con las otras máquinas podrían tener menor productividad. Esto indicaría que hay interacción entre el nivel académico y el tipo de máquina.

Para probar si hay interacción entre los dos factores es necesario diseñar el experimento por bloques con al menos dos datos para cada combinación tratamiento – bloque.

De esta manera se pueden investigar las hipótesis:

Para los tratamientos: H₀ : m₁ = m₂ = … = m_k

H₁ : Al menos una media es diferente

Para los bloques: H₀ : m₁ = m₂ = … = m_n

H₁ : Al menos una media es diferente

Para la interacción: H₀ : Los factores no interactúan respecto a la variable investigada.

H₁ : Los factores sí interactúan respecto a la variable investigada.

En este caso se consideran tres varianzas explicadas: de los tratamientos, de los bloques y de la interacción.

Si r es el número de datos en cada combinación tratamiento – bloque, y n el número de bloques en cada muestra, el número total de datos que hay en cada muestra es nr; por lo tanto, la varianza explicada de los tratamientos s_ET² se calcula con la expresión:

La varianza explicada de los bloques se calcula con una expresión similar. El número de bloques es n, y el número de datos en cada bloque es kr. La varianza explicada de los bloques será entonces:

Se considera que hay interacción entre los dos factores que actúan sobre las unidades experimentales, si la diferencia entre la media de los r datos de una combinación tratamiento – bloque y la media total difiere de la suma de dos diferencias: una entre la media del tratamiento correspondiente y la media total , y otra entre la media del bloque correspondiente y la media total . Así, para todas las combinaciones tratamiento – bloque, estas diferencias miden la interacción entre los factores. La interacción, para cada combinación tratamiento – bloque se mide entonces con la expresión:

Simplificando, cada interacción resulta:

La interacción total se mide con la varianza explicada de la interacción, que se calcula entonces con la siguiente expresión:

Al numerador se le conoce como suma de los cuadrados de la interacción (SSI), y el denominador representa el número de grados de libertad. A este cociente también se le llama promedio de los cuadrados de la interacción (PPI).

La varianza no explicada o error es:

Para determinar si cada una de las tres varianzas explicadas es mayor que la varianza no explicada o varianza del error, se hacen tres Pruebas F de comparación de varianzas:

Se aceptará cada hipótesis nula si:

Si se acepta la hipótesis nula de la varianza de las medias de los tratamientos, se estaría aceptando que las medias de los tratamientos no difieren significativamente, es decir, que las medias de los tratamientos son iguales (H₀: m₁ = m₂ = … = m_k).

Si se acepta la hipótesis nula de la varianza de las medias de los bloques, se estaría aceptando que las medias de los bloques no difieren significativamente, es decir, que las medias de los bloques son iguales (H₀: m₁ = m₂ = … = m_n).

Si se acepta la hipótesis nula de la varianza de las medias de los tratamientos, se estaría aceptando que las interacciones medidas en cada combinación tratamiento – bloque son muy pequeñas, es decir, se estaría aceptando que no hay interacción.

Tabla ANOVA

Los valores que se calculan para este análisis de varianza se expresan en la siguiente tabla.

Ejemplo 3:

El gerente de producción de una fábrica quiere evaluar tres máquinas. Para esto asigna cinco empleados a cada máquina, distribuyéndolos de acuerdo a su nivel académico, de manera tal que cada máquina sea operada por empleados de los cinco niveles en que se les ha clasificado previamente. De esta forma ninguna máquina se verá favorecida al asignarle más operarios de mayor nivel académico. Como es probable que haya interacción entre el tipo de máquina y el nivel académico de los empleados, respecto a la productividad de estos, se consideraron dos empleados para cada combinación tipo de máquina – nivel académico. En la tabla adjunta se muestra la producción diaria.

¿Se puede afirmar que las tres máquinas tienen la misma productividad?

Se plantean las siguientes hipótesis:

Para los tratamientos: H₀ : m₁ = m₂ = m₃

(máquinas) H₁ : Al menos una media es diferente

Para los bloques: H₀ : m₁ = m₂ = m₃ = m₄ = m₅

(niveles académicos) H₁ : Al menos una media es diferente

Para la interacción: H₀ : No hay interacción entre el tipo de máquina y el nivel académico de los empleados, respecto a la productividad de estos.

H₁ : Sí hay interacción entre dichos factores.

Ingresando al menú Datos/Análisis de datos/Análisis de varianza de dos factores con varias muestras por grupo, Excel muestra el cuadro de diálogo de la siguiente figura. En este cuadro ya se han ingresado los datos del problema.

Hay dos particularidades en el cuadro de diálogo de Excel para este análisis que incluye la posible interacción entre los factores. La primera es que en el rango de entrada deben incluirse no solo los datos (valores numéricos) sino también los títulos (rótulos) de las filas y columnas. Esto era opcional en los dos casos anteriores. A continuación se presentan los datos de este problema, tal como se escribieron en la hoja de cálculo de Excel:

La segunda particularidad es la opción Fila por muestra del mismo cuadro de diálogo antes visto, donde se debe indicar el número de datos que hay en cada combinación tratamiento – bloque. En este problema hay dos datos por cada combinación.

Aceptando los datos ingresados en el cuadro de diálogo, Excel presenta dos tablas: la primera es un resumen de los datos de cada bloque y de cada tratamiento, incluyendo sus respectivas medias y varianzas; y la segunda es la tabla ANOVA del problema, como se muestra a continuación:

En esta última tabla ANOVA, Excel expresa “muestra” en vez de filas, como debería ser.

Para las filas resulta: F > F*; por lo tanto se rechaza la hipótesis nula (H₀: m₁ = m₂ = m₃). Se puede afirmar entonces que las tres máquinas no tienen la misma productividad.

Para las columnas: F > F*; por lo tanto se rechaza la hipótesis nula (H₀: m₁ = m₂ = m₃ = m₄ = m₅). Se puede afirmar entonces que la productividad no es la misma en los distintos niveles académicos de los empleados.

Para la interacción: F > F*; por lo tanto, se rechaza la hipótesis de que los factores no interactúan. Se puede afirmar entonces que el tipo de máquina y el nivel académico sí interactúan, lo cual afecta la productividad de los empleados.

El lector debe llegar a estas mismas tres conclusiones interpretando los valores de Probabilidad (p-value) de la tabla ANOVA, tal como se hizo en el ejemplo 1.

Estadísticas de César Angulo Bustíos

Buscar este blog