viernes, 7 de octubre de 2016

4 INTERVALOS DE CONFIANZA

Los intervalos de confianza son las primeras herramientas que te introducen en un curso de estadística. Estos están pensados para determinar un intervalo cuyos límites contendrán al promedio real de la población por medio del uso de promedios de muestra y la desviación estándar.  Para calcularlos sin embargo es conveniente aclarar una serie de conceptos previos que se pasan fácilmente por alto cuando se los introduce en los estadísticos descriptivos.

4.1 Promedio de la población y promedio de la muestra

Una de las cosas que confunden en estadística es que se empiezan a usar símbolos diferentes para algo que aparentemente es lo mismo, como el promedio y la desviación estándar. El problema aquí es que aunque la fórmula de cálculo aritmético es la misma, el concepto es extremadamente diferente.

4.1.1 Promedio de la población

El promedio de la población hace referencia a la suma de todos los valores medibles en TODA la población dividido en la cantidad de individuos de toda la población. Evidentemente es imposible medir toda la población o todo el conjunto de datos del universo para una medición, por lo que obtener el promedio de la población es solo un artefacto analítico, pero imposible en la práctica.

4.1.2 Promedio de la muestra

Por el contrario el promedio de la muestra hace referencia a un subconjunto tomado de la población completa. En este punto se introduce el concepto de muestreo. La muestra que se obtiene de la población general debe representarla, de forma tal que al calcular el promedio de la muestra, este de alguna forma se acerque al promedio real de la población. Si el muestreo posee sesgos de selección, entonces el promedio de la muestra no representará de forma adecuada al promedio de la población.

4.1.3 Símbolos

Los símbolos del promedio de la población y del promedio de la muestra son diferentes. El promedio de la población se simboliza con la letra griega mu (μ) mientras que el promedio de la muestra se simboliza con el símbolo típico de promedio.


4.1.4 Objetivo de un intervalo de confianza

El objeto de un intervalo de confianza es que dados datos limitados de una muestra se obtenga un estimado que contenga al promedio de la población. Por lo general los instrumentos estadísticos nos permitirán hacerlo de forma correcta con un estimado de confianza del 95%, o el 99% empleando una serie de tablas. A este límite de confianza o límite de exclusión lo conoceremos de aquí en adelante como el alfa.

Referencias generales: (McDonald, 2015)

4.2 Desviación estándar de la población y desviación estándar de la muestra

Del mismo modo que sucede con el promedio, la desviación estándar se divide en la desviación de la población y la desviación de la muestra. El símbolo para la desviación estándar de la población es sigma minúscula mientras que el símbolo para la desviación estandar de la muestra es s.

Recordemos que la potencia a la ½ se traduce como una raíz cuadrada.

4.3 Error estándar

El error estándar tiene diferentes formas dependiendo si lo estamos haciendo con la desviación estándar de la población o si lo hacemos con la desviación de la muestra. En cualquier caso se trata de dividir la desviación entre la raíz cuadrada del número de individuos


4.3.1 Estadístico Z

El estadístico Z se emplea cuando se conoce la desviación estándar de la población, de forma tal que el error estándar adquiere la forma completa (5) el problema es que es improbable que conozcamos a mu y que podamos contar a todos los individuos de la población, por lo que eso se traducirá a tener una población grande. El problema es definir qué tan grande.

Sí la población sumara las 30 mediciones se dice que es suficientemente grande para emplear el estadístico Z, de forma tal que la desviación estándar de la muestra será lo suficientemente grande para aproximarse significativamente a la desviación estándar de la población (6). Por lo que el error estándar con el estadístico Z realmente se calculará de la forma (7).

4.3.2 Estadístico t

El estadístico t se emplea cuando no se conoce la desviación estándar de la población “pero si se conoce la desviación estándar de la muestra”. En este orden de ideas el error estándar toma la siguiente forma.

En la práctica diremos que no conocemos la desviación estándar de la población cuando no es adecuado aproximar la desviación de la población y de la muestra. ¿Cómo reconocerlo dicho punto? Pues cuando el tamaño de la muestra sea inferir a 30 repeticiones. Debido a que muchos experimentos hacen incluso menos de 10 repeticiones por mucho el intervalo de confianza empleando el estadístico t de student es el que más se emplea.

Referencias generales: (McDonald, 2015)

4.4 La tabla Z

La tabla Z que debemos emplear y las que encontramos difieren, de hecho existen tres tablas de la Z. La que debemos emplear se denomina “Cumulative from mean (0 to Z)” o acumulación desde la Z desde 0 hasta Z. Si no tiene el nombre se reconoce porque su esquema de normalidad sombrea desde 0 hasta Z.

La forma en que buscamos en esta tabla difiere fuertemente del uso de otras tablas. En otras tablas buscas en la primera fila y la primera columna para encontrar un valor en el “relleno” de la tabla. Aquí es al contrario, debemos encontrar el valor en el relleno de la tabla inicialmente.

El relleno de la tabla posee una gran variedad de labores que conocemos colectivamente como alfa medios. Alfa medios se calcula a través del alfa porcentual con la siguiente fórmula. 

Recuerde que en esta fórmula empleamos valores de alfa como 95% o 99%, de lo contrario hay que hacerle modificaciones.

Para un alfa del 95%, alfa medios vale 0.47500, por lo que procedemos a buscarlo en el relleno de la tabla Z.

Una vez encontramos alfa medios en la tabla debemos “armas” el valor Z correspondiente mirando la primera fila y la primera columna. En la primera columna nos dan los primeros dos dígitos del valor de Z, y en la primera fila el tercer dígito. En el ejemplo anterior la primera columna nos dio 1,9 y la primera fila +0,06 por lo que Z= 1,9+0,06 = 1,96.

A continuación dejamos una tabla Z.

Referencias generales: (McDonald, 2015)


4.5 Tabla T de student

La tabla T de Student se usa normalmente, en la primera fila se identifica el punto crítico que normalmente sería 0,05 y en la primera columna se busca el valor igual al (n) que siempre será menor a 30, luego en la intersección se obtiene la t crítica.


4.6 Intervalo de confianza con z



4.7 Intervalo de confianza con t



Referencias generales: (McDonald, 2015)

No hay comentarios:

Publicar un comentario