ANOVA (análisis de varianza) es una técnica estadística utilizada para verificar si los medios de dos o más grupos son significativamente diferentes entre sí. Puede parecer extraño que se llame «análisis de varianza» en lugar de «análisis de medios». Sin embargo, el nombre es apropiado ya que hacemos inferencias sobre las medias analizando la varianza. Si solo comparamos dos medias, ANOVA producirá los mismos resultados que la prueba t para muestras independientes (si comparamos dos grupos diferentes) o la prueba t para muestras dependientes (si comparamos dos variables en un conjunto de observaciones). Entonces, ¿por qué no usar múltiples pruebas t? Si tuviera que realizar múltiples pruebas t para comparar más de dos muestras, tendrá un efecto compuesto en la tasa de error del resultado. Aplicación: Considere un escenario en el que obtenga una muestra de los ingresos anuales de los empleados de tres geografías diferentes. Es posible que desee comparar si hay una diferencia en el ingreso promedio de los empleados en función de las geografías. En este caso, usaría ANOVA para comparar el ingreso promedio. Otra aplicación de ANOVA se puede encontrar en el sector médico. Para comprender un método de tratamiento confiable para una enfermedad, se crearían múltiples grupos de prueba (basados ​​en la metodología de cura). Intentarían medir la cantidad de días que se necesita para curar para cada grupo de prueba. Aquí, ANOVA se puede usar para probar/refutar si todos los tratamientos de medicamentos fueron igualmente efectivos o no. Suposiciones Los siguientes son los supuestos en ANOVA: cada muestra de grupo se extrae de una población normalmente distribuida. Las poblaciones tienen una varianza común que las muestras se dibujan independientemente entre sí dentro de cada muestra, las observaciones se muestrean aleatoria e independientemente de las terminologías de las terminologías Grand Media: la media es un promedio simple o aritmético de un rango de valores. En ANOVA, utilizamos dos tipos de medias: la gran media (media de toda la muestra) y las medias de muestra grupal (media de cada grupo individual). Hipótesis: una hipótesis es una declaración que se sugiere como una posible explicación para una situación o condición particular, pero que aún no se ha demostrado que sea correcta. En el caso de ANOVA, tenemos una hipótesis nula y una hipótesis alternativa. Hipótesis nula: todas las medias de muestra son iguales, o no tienen ninguna diferencia significativa. Hipótesis alternativa: al menos una de las medias de muestra es diferente del resto de las medias de la muestra. Tenga en cuenta que todavía no podemos saber qué grupo es específicamente diferente del resto de los demás. Variabilidad entre grupos (efecto cuadrado medio): se refiere a variaciones entre las distribuciones de grupos individuales, ya que los valores dentro de cada grupo son diferentes. Para calcular el efecto cuadrado medio, observamos cada muestra para calcular la diferencia entre su media y la gran media. Suma de cuadrado para la variabilidad entre grupos (SSB): es el agregado de las diferencias cuadradas entre la media de la muestra y la gran media. Suma media del cuadrado para la variabilidad entre grupos (MSB): se calcula dividiendo la suma del cuadrado (variabilidad entre grupos) y los grados de libertad (número de medias de muestra-1) Variabilidad dentro del grupo (efecto cuadrado medio): se refiere a variaciones causadas por diferencias dentro de los grupos individuales, ya que no todos los valores dentro de cada grupo son los mismos. Cada muestra se considera de forma independiente, no hay interacción entre muestras y se calcula la variabilidad entre los puntos individuales en la muestra. Suma de cuadrado para la variabilidad dentro del grupo (SSW): es el agregado de la desviación al cuadrado de cada valor de su media de muestra respectiva. Suma media del cuadrado para la variabilidad dentro del grupo (MSW): se calcula dividiendo la suma de cuadrado (variabilidad dentro del grupo) y los grados de libertad (la suma de los grados de libertad individuales para cada muestra). Dado que cada muestra tiene grados de libertad iguales a uno menos que sus tamaños de muestra, y hay k muestras, los grados totales de libertad son k menos que el tamaño total de la muestra: df = n – k. Variación total: es la suma de los cuadrados de las diferencias de cada media con la gran media que también es la suma de SSB y SSW. La idea total detrás del análisis de varianza es comparar la relación de varianza entre grupos con la varianza dentro del grupo. Si la varianza causada por la interacción entre las muestras es mucho mayor en comparación con la varianza que aparece dentro de cada grupo, entonces es porque las medias no son las mismas. F estadística de prueba: mide si los medios de diferentes muestras son significativamente diferentes o no. Se calcula dividiendo MSB y MSW. Bajo la relación F, más similares son las medias de muestra. En ese caso, no podemos rechazar la hipótesis nula. La estadística F calculada aquí se compara con el valor crítico F para llegar a una conclusión. Si el valor del estadístico F calculado es más que el valor crítico F (para un nivel específico de α/significancia), entonces rechazamos la hipótesis nula. Tabla de resumen: Variabilidad Sume de los grados cuadrados de la libertad Media Square F Estadística entre SSB K-1 SSB/(K-1) MSB/MSW Dentro de SSW N-K SSW/(N-K) Total SSB + SSW N-1 Tipos de ANOVA PRUEBA para análisis univariados. El ANOVA unidireccional se usa cuando estamos interesados ​​en estudiar el efecto de una variable independiente (IDV)/factor en una población, mientras que se usa ANOVA bidireccional para estudiar los efectos de dos factores en una población al mismo tiempo. One Way ANOVA en Excel 2013 Los siguientes pasos lo ayudarán a llevar a cabo ANOVA en Microsoft Excel 2013: Paso 1: Ingrese sus datos en filas y columnas en Excel. Si tiene tres grupos como se muestra en el ejemplo, extienda los datos en tres columnas. Paso 2: haga clic en la pestaña «Datos» en la cinta y luego haga clic en «Análisis de datos». Si no ve el análisis de datos, cargue el complemento ‘Toolpak de análisis de datos’. Se puede cargar haciendo clic en «Opciones: en el menú Archivo. Luego haga clic en» complementos «y podrá administrar sus complementos. Paso 3: haga clic en» Factor único ANOVA «y luego haga clic en» Aceptar «. Luego, ingrese el rango de valores y establezca el valor Alpha (predeterminado = 0.05, 95% de confianza). Haga clic en» Aceptar «para ver la salida de Excel. Podemos rechazar la hipótesis nula y concluir que hay una diferencia significativa entre las medias de las cuatro muestras. No ve el análisis de datos, cargue el complemento de ‘Toolpak de datos’. no logró rechazar la hipótesis nula (p <0.05) y, por lo tanto, no hay diferencia en los medios.