domingo, 9 de octubre de 2016

10 ALGUNAS PRUEBAS DE CORRELACIÓN

Típicamente solo se emplea la regresión lineal para los cursos básicos así que solo trabajaremos esa correlación por el momento.

10.1 Regresión lineal

La regresión lineal es un método de correlación de datos que va a buscar la relación entre dos variables. Este es tal vez uno de los métodos más viejos de matematización en ciencias, aunque su forma antigua era más bien intuitiva y seguía la fórmula (1) si existe una relación directamente proporcional entre dos variables, entonces debe haber una constante de proporcionalidad (2) que permite igualar los valores de las variables. Dichas constantes de proporcionalidad recibían el nombre de sus descubridores o la que sus descubridores desearan ponerle, por ejemplo el coeficiente de proporcionalidad de un resorte (3).

En la actualidad la regresión lineal no es un proceso intuitivo, por el contrario, existe un estándar para realizar el procedimiento de obtención de la fórmula, de forma tal que podamos expresar el valor de la constante de proporcionalidad. 

Adicionalmente el método va a funcionar como una prueba de hipótesis, en la cual podemos tener estos dos caos o sus variantes en un espectro continuo.

En el caso (a) tenemos que la serie de datos se ajusta bien a un modelo lineal, mientras que en el segundo caso (b) no es así. El procedimiento de la regresión lineal arroja un coeficiente llamado r cuadrado que servirá como el estándar de linealidad. Valores de r cuadrado superiores al 0,9 se consideran normalmente como indicadores de una fuerte linealidad, aunque para estar seguros también se puede tomar valores de la fórmula lineal obtenida y realizar pruebas de hipótesis para comparar series de datos experimentales y teóricas como la chi cuadrada. En base a lo anterior las hipótesis nula y alternativa serian respectivamente que el conjunto de datos (x;y) pueden o no pueden ser representados por el modelo de la línea recta.

La regresión lineal inicia por reconocer las propiedades de la línea recta y su fórmula general.

La fórmula general de la recta (4) posee a parte de los valores (x;y) dos variables más, (m) es la pendiente, que va a representar la constante de proporcionalidad, en ese orden de ideas vamos a simbolizar de aquí en adelante la pendiente como el símbolo k. Mientras que la variable (b) va a representar el intersecto en (y) cuando (x) vale cero.

Dado lo anterior nuestra ecuación de la recta adquirirá la siguiente forma.

Una vez teniendo lo anterior claro, hay que tener en cuenta que debemos trabajar con una tabla de datos reales (x; y) que puede ser horizontal o vertical.

Ahora vamos a expresar la primeria serie de fórmulas.

Con los datos base ya podemos empezar a extraer los datos que si nos importan como la pendiente y el intersecto en (y)

10.2 Otros tipos de regresión

Otros tipos de regresión involucran procesos más complejos que de ser necesario es mejor resolver por medio de Excel u otros programas estadísticos más potentes. En cualquier caso siempre nos arrojará la correlación r cuadrado que determinará que tanto se ajustan los datos de la fórmula con respecto a los datos experimentales.

Referencias generales: (McDonald, 2015)

No hay comentarios:

Publicar un comentario