domingo, 9 de octubre de 2016

8 ALGUNAS PRUEBAS DE VARIABLES CONTINUAS

Cuando no podemos separar las parejas de datos en categorías claras o cuando las categorías son muchas, (más de seis).

8.1 t de student para una muestra

En este caso se emplea para comparar el promedio de una variable continua con respecto a una expectativa teórica. Las hipótesis a probar son:

a- hipótesis nula: No existen diferencias significativas entre el promedio experimental y el promedio teórico
b- hipótesis alternativa: existen diferencias significativas entre el promedio experimental y el promedio teórico

La fórmula es la siguiente
Una vez que se ha determinado de realizar la t calculada, debemos identificar la t teórica en la tabla con los grados de libertad y un límite de exclusión. Por lo general el límite de exclusión es del 95% o lo que es lo mismo el valor de 0,05. Si el valor calculado es mayor que el valor de t rechazamos la hipótesis, y si es menor lo aceptamos.

Esta prueba se emplea cuando realizas mediciones de la masa de un objeto y la quieres comparar con un dato teórico o de fabricación.

8.2 ANOVA de una via

La ANOVA de una vía es matemáticamente idéntica a la prueba t de student de dos muestras, por lo que no redundaremos y emplearemos las ANOVAS.

En ambos casos se trata de comparar una variable continua con una variable discreta. La variable discreta divide a la variable continúa en dos grupos. Como siempre debemos analizar dos hipótesis

a- Hipótesis nula: no existen diferencias significativas entre las varianzas de los dos grupos.
b- Hipótesis alternativa: si existen diferencias significativas entre los dos grupos de varianzas.

Antes de enunciar las fórmulas miremos su empleo con un ejemplo.
El cálculo de las ANOVAS no es para nada simple, así de lo deberemos trabajar paso a paso. Inicialmente tendremos una tabla que posee (k) cantidad de variables discretas, cada una medida (n) veces de forma continua. En consecuencia será una tabla con (k) cantidad de columnas y (n) cantidad de filas.

Posteriormente procedemos a identificar los dos tipos de grados de libertad, los grados de libertad entre las variabkles y los grados de libertad internos.

En esta fórmula (k) representa la cantidad de columnas de la variable categórica, mientras que (N) representa la totalidad de datos individuales que será igual al producto de (n) filas por (k) columnas. Con lo grados de libertad se procede a buscar la F crítica en la tabla. Cuando se busque en la tabla hay varias opciones para cada pareja de grados de libertad, por lo que elegimos el límite de exclusión crítico más común que es el 0,05.

Una vez identificado lo anterior, procedemos a resolver la F calculada que es lo más duro, especialmente si lo debemos realizar con lápiz y papel bajo la presión cronométrica de un examen, pero al mal tiempo buena cara. Primero debemos obtener el promedio simple de cada una de las columnas.

En la fórmula (6) tenemos un esquema general de la fórmula del promedio, que es la suma de datos de cada columna dividido entre el numero datos de cada columna. En este caso D se reemplaza por los datos de cada columna. La fórmula (7) implica el promedio de la columna (a) y la fórmula (8) representa el promedio de la última columna que tengamos que realizar, que puede ser más de cuatro.

Posteriormente obtenemos el gran promedio, el cual puede obtenerse por dos rutas. La primera es (9) es mediante la suma de sumas de todos los datos de todas las columnas dividido entre la cantidad total de datos N. La segunda es mediante el promedio de promedios, en este caso se suman los datos de los promedio de cada columna y se divide entre la cantidad k de columnas.

Obtenemos la suma de diferencias total. Aunque la fórmula es compleja, la doble sumatoria implica que debemos hacer esto para cada fila y cada columna, en resumen para todos los datos debemos restar el dato individual con respecto al gran promedio y el resultado elevarlo al cuadrado, para finalmente sumar todos los resultados. Evidentemente es uno de los pasos más largos cuando se realiza el proceso manualmente.

Luego obtenemos la suma de cuadrados por cada columna, en (12) tenemos la fórmula general donde D se reemplaza por los dados de cada columna iniciando en la columna a y terminando en la columna z. En (13 y 14) tenemos ejemplos de fórmulas concretas para la columna inicial (a) y para la columna final (z).

Obtenemos la suma de cuadrados inter datos (16) y la suma de cuadrados entre datos (17).

Finalmente obtenemos las varianzas respectivas empleando la suma de cuadrados y la F calculada. Finalmente si la F calculada es mayor a la F de la tabla entonces rechazamos la hipótesis, con la posibilidad de existencia de diferencias significativas en al menos una de las categorías con respecto al resto, pero aun no sabríamos cual. 

Para determinar cuáles son los que se diferencias se realiza una segunda prueba denominada prueba de Tukey.

8.3 Prueba de tukey

La prueba de Tukey se emplea para determinar si la diferencia entre cada pareja de promedios posee diferencias significativas. Esta prueba a diferencia de la ANOVA solo mide una pareja por vez.

Siendo en este caso las hipótesis:

a- Hipótesis nula: no existen diferencias significativas.
b- Hipótesis alternativa: si existen diferencias significativas.

Lo único complejo que posee esta prueba es identificar el valor crítico (q) que también se obtiene de una tabla. El q de la tabla se obtiene ubicando la cantidad total de datos N y la cantidad de columnas k. En la tabla la fila será igual a la cantidad total de datos N y la columna será la cantidad de columnas k de la tabla con la que se hizo la ANOVA. 

Por ejemplo si teníamos una tabla de ANOVA de 3 columnas y 7 datos por cada columna el valor crítico de (q) = 3,61. En caso de que tengamos una tabla q que nos de varias respuestas para los dos grados de libertad, significa que cada valor tiene un límite de exclusión también llamado alfa diferente. Elegimos el típico del 0,05.

En caso de requerir apoyo en sus ejercicios de lápiz y papel, recomendamos la siguiente página:

http://vassarstats.net/anova1u.html

Referencias generales: (McDonald, 2015)

No hay comentarios:

Publicar un comentario