Buscar este blog

Translate

martes, 30 de junio de 2026

Introducción a la estadística

Regresar a [Introducción a las ciencias y otros]

La estadística se define como la rama de las matemáticas encargada de recolectar, organizar, representar, analizar e interpretar datos para comprender fenómenos variables. Su importancia va desde situaciones cotidianas, como leer una encuesta o comparar resultados escolares, hasta problemas complejos en ciencia, economía, salud pública, educación, biología, política y tecnología. En lugar de quedarse en opiniones aisladas, la estadística permite transformar muchos datos dispersos en información comprensible, ayudando a tomar decisiones con mayor fundamento.

En sus primeras etapas de aprendizaje, la estadística se apoya mucho en el lenguaje gráfico y, por tanto, también en una base geométrica. Tablas, diagramas de barras, gráficos circulares, histogramas y líneas de tendencia permiten visualizar patrones antes de formalizarlos con ecuaciones. Esta entrada visual es fundamental, porque ayuda a reconocer distribuciones, frecuencias, comparaciones, variaciones y relaciones entre variables. Sin embargo, a medida que el análisis se vuelve más exigente, la estadística necesita avanzar hacia el lenguaje algebraico simbólico, donde aparecen fórmulas, parámetros, modelos, probabilidades e inferencias.

Gracias a ese desarrollo simbólico, la estadística moderna alcanza niveles de precisión imposibles de lograr solo con observación visual. Hoy permite estimar riesgos, evaluar tratamientos médicos, diseñar experimentos, detectar errores, construir modelos predictivos y analizar grandes volúmenes de información. Su papel es tan importante que sostiene parte de la sociedad contemporánea: desde censos y políticas públicas hasta machine learning, inteligencia artificial y modelos de lenguaje. En síntesis, la estadística no es solo hacer gráficos; es una forma rigurosa de convertir datos en conocimiento útil para interpretar el mundo.

Figura 1. [Sir Ronald Ailmer Fisher] fue un matemático, estadístico y biólogo evolutivo británico. Desarrolló conceptos clave como varianza, diseño experimental, máxima verosimilitud y análisis de varianza. En Rothamsted mejoró la investigación con aleatorización y repetición. También vinculó genética mendeliana y selección natural, aunque su legado es discutido por sus posturas eugenésicas, hoy éticamente rechazadas.

Figura 2. [Florence Nightingale] fue una enfermera británica clave en la modernización de la enfermería. Durante la guerra de Crimea mejoró higiene, ventilación, alimentación y organización hospitalaria, reduciendo muertes evitables. Usó estadística para demostrar la importancia de las condiciones sanitarias. Fundó una escuela profesional de enfermería y dejó un legado en salud pública, epidemiología y cuidado basado en evidencia.

Parámetro de conteo

La estadística básica se fundamenta en dos parámetros iniciales: el parámetro de cantidades y el parámetro de probabilidades. El primero responde a la pregunta “¿cuántos hay?”, mientras que el segundo responde a la pregunta “¿qué tan posible es que ocurra?”. Antes de calcular probabilidades, porcentajes o comparaciones, es necesario contar correctamente los elementos de cada categoría. Por eso, el conteo es el punto de partida de cualquier análisis estadístico sencillo.

El parámetro de cantidades se refiere al número de entidades que pertenecen a una categoría específica o al total de entidades de todas las categorías de un sistema. Por ejemplo, si tenemos una colección de canicas de varios colores, podemos contar cuántas hay en cada grupo: 4 rojas, 5 azules y 6 amarillas. En lenguaje matemático, estos conteos se expresan usando la letra n, que representa la cantidad de elementos:

n(rojas) = 4
n(azules) = 5
n(amarillas) = 6

Para el conteo general usaremos n(total), que representa la suma de todas las categorías observadas. En este caso:

n(total) = n(rojas) + n(azules) + n(amarillas)
n(total) = 4 + 5 + 6
n(total) = 15

Así, el sistema completo contiene 15 canicas. Este conteo total será la base para calcular proporciones, frecuencias relativas y probabilidades. Por ejemplo, solo después de conocer n(total) podemos preguntar qué parte del conjunto corresponde a las canicas rojas, azules o amarillas.

En matemáticas tratamos de usar lenguajes abreviados para generalizar procedimientos. Esto es importante porque no siempre sabemos cuántas categorías tiene un sistema. En el ejemplo anterior teníamos canicas rojas, azules y amarillas, pero otro conjunto podría tener muchas más: verdes, negras, blancas, moradas o incluso una cantidad muy grande de colores posibles. Por eso, en lugar de escribir cada suma una por una, usamos una notación más general.

La palabra suma describe bien la operación, pero en lenguaje matemático resulta más práctico usar el símbolo sigma, escrito como Σ. Este símbolo permite representar una suma de muchas cantidades sin tener que escribir todos los términos. Si llamamos nᵢ a la cantidad de elementos de cada categoría y k al número total de categorías, podemos escribir:

Figura 3. [Axioma de suma de entidades]. Un axioma es un punto de partida del pensamiento matemático. El axioma de suma de entidades contables afirma que la cantidad total de un sistema, simbolizada como nₜₒₜ, se obtiene sumando las cantidades de cada categoría, nᵢ. La Σ indica suma general y permite construir fracciones, proporciones, concentraciones y probabilidades.

Tabla de datos y gráfica de barras categóricas

Una vez que ya sabemos contar, el siguiente paso en estadística básica es organizar la información. Para eso usamos dos herramientas iniciales: la tabla de datos y la gráfica de barras categóricas. La tabla permite ordenar los conteos de manera clara, mientras que la gráfica transforma esos mismos datos en una representación visual. Es decir, primero contamos cuántas entidades hay en cada categoría y luego decidimos cómo presentar esa información para que pueda leerse, compararse e interpretarse con mayor facilidad.

En una tabla de datos categóricos usamos, como mínimo, dos columnas. En el encabezado de la primera columna escribimos el tipo de categoría que estamos clasificando; en la segunda columna escribimos n, que representa el conteo de entidades de cada categoría. En el ejemplo de las canicas, la categoría sería el color, y los conteos serían 4 rojas, 5 azules y 6 amarillas.

Sin embargo, aunque la tabla de datos es ordenada y precisa, no siempre ofrece mucha riqueza visual. Uno puede leer los números, sí, pero la comparación no entra tan rápido por los ojos. Por eso recurrimos a la gráfica de barras categóricas, que permite representar cada categoría mediante una barra cuya altura corresponde al conteo. Didácticamente, puede imaginarse como una pila de monedas: una barra de 4 unidades para las canicas rojas, una de 5 para las azules y una de 6 para las amarillas. Así, sin hacer muchos cálculos, vemos de inmediato que hay más canicas amarillas, luego azules y finalmente rojas.

En una gráfica de barras categóricas, el eje horizontal muestra las categorías y el eje vertical muestra la cantidad o frecuencia absoluta. Las barras deben tener el mismo ancho, estar separadas entre sí y comenzar desde cero, porque representan conteos independientes. No se unen con líneas, ya que los colores no forman una secuencia continua como el tiempo o la temperatura. En nuestro ejemplo, la gráfica tendría tres barras: una para rojas con altura 4, una para azules con altura 5 y una para amarillas con altura 6. Así, la tabla organiza los datos y la gráfica permite compararlos visualmente.

 

Figura 4. [Tabla de datos y gráfico de barras]. La tabla de datos organiza entidades por categorías y muestra su cantidad n. La gráfica de barras representa esos conteos visualmente para comparar categorías. Este proceso es base del pensamiento estadístico y del pensamiento químico-atómico, porque permite contar átomos, moléculas o iones antes de calcular proporciones, probabilidades o concentraciones.

Ratios, proporciones y el axioma de probabilidad

Un ratio o proporción es una forma de comparar dos parámetros, generalmente dos conteos. Podemos pensarlo como una relación entre cantidades. Por ejemplo, cuando alguien dice que una apuesta está “dos a uno”, quiere decir que por cada 1 unidad de una categoría hay 2 unidades de otra. En lenguaje abreviado, esa relación puede escribirse como 2:1. Esta expresión no significa una suma, sino una comparación: indica cuántas veces aparece una cantidad frente a otra.

Figura 5. [Los números racionales] son cantidades que pueden escribirse como fracción a/b, con a y b enteros y b distinto de cero. Representan una división abreviada: el numerador funciona como dividendo y el denominador como divisor. No los inventó una sola persona; surgieron en civilizaciones antiguas para repartir, medir, comerciar y comparar cantidades mediante razones matemáticas precisas y útiles cotidianamente.

Los ratios pueden expresarse de varias formas. La primera es la forma de apuesta o comparación directa, como 2:1. La segunda es la forma decimal, como 0.5. La tercera es la forma de número racional, como 2/1. Un número racional es un número que puede escribirse como una división entre dos números enteros, siempre que el denominador no sea cero. Por ejemplo, 1/2, 3/4, 5/10 y 2/1 son números racionales porque expresan una relación entre una parte y otra cantidad de referencia.

En estadística básica nos enfocaremos especialmente en la forma de número racional, porque permite convertir los conteos en proporciones, porcentajes y gráficas proporcionales.

Figura 6. [Notación porcentual]. Los números racionales expresan una división entre enteros como fracción a/b, con denominador distinto de cero. El numerador funciona como dividendo y el denominador como divisor. Además, pueden convertirse en porcentaje multiplicando por 100: mover el separador decimal dos lugares a la derecha resume esa operación y permite comparar proporciones sobre una base de cien en contextos estadísticos escolares sencillos.

Axioma de la probabilidad

Figura 7. [El axioma de la probabilidad clásica] indica que la posibilidad de una categoría depende de comparar su conteo con la cantidad total del sistema. Primero se reconocen las categorías, luego se cuenta cada una, se suma para obtener el total y finalmente se compara cada parte con ese total. Así se conectan conteo, proporción y probabilidad.

Figura 8. [Cálculo de una probabilidad simple]. El ejercicio muestra cómo calcular la probabilidad clásica contando primero el total de esferas y luego comparando cada color con ese total. Las fracciones resultantes deben simplificarse y convertirse en decimales y porcentajes: 4/20 = 20 %, 6/20 = 30 % y 10/20 = 50 %. Así, fracción, decimal y porcentaje expresan la misma relación matemática básica escolar.

Gráficas proporcionales

Los porcentajes son una forma de expresar una proporción utilizando como referencia una base de cien. Por ello, cualquier porcentaje puede interpretarse como una fracción cuyo denominador es 100, o como un número decimal equivalente. Un mismo porcentaje puede representarse mediante distintos recursos gráficos, como una cuadrícula, una barra segmentada, un rectángulo dividido, una línea proporcional o un gráfico circular. Aunque cada representación tiene un aspecto diferente, todas comunican exactamente la misma información: qué fracción del total corresponde a una determinada categoría. Estas herramientas facilitan la comprensión visual de los datos y permiten comparar cantidades de manera inmediata sin necesidad de realizar cálculos complejos.

El ejemplo del 25 % ilustra claramente esta equivalencia. En la cuadrícula de 10 × 10 aparecen coloreados 25 cuadrados de un total de 100, representando la fracción 25/100, equivalente a una cuarta parte del total. Este mismo valor puede representarse en una barra ocupando una cuarta parte de su longitud, en un rectángulo coloreando uno de sus cuatro sectores, o sobre una línea proporcional señalando el punto correspondiente al 25 %. Todas estas representaciones son equivalentes porque conservan la misma relación entre la parte y el todo. Comprender estas equivalencias permite pasar con facilidad entre el lenguaje numérico y el lenguaje gráfico, fortaleciendo el razonamiento proporcional y la interpretación de datos estadísticos.

El gráfico de torta o gráfico circular constituye una de las representaciones más utilizadas para mostrar porcentajes. En este tipo de gráfico, el círculo completo representa el 100 %, equivalente a un ángulo total de 360°. Por ello, cada porcentaje puede transformarse en un ángulo proporcional del círculo. Así, un 25 % ocupa una cuarta parte del círculo, correspondiente a 90°, mientras que un 50 % representa media circunferencia y un 75 % ocupa tres cuartas partes. La conversión de porcentajes a ángulos garantiza que el área visual de cada sector conserve exactamente la proporción de los datos originales. Este procedimiento permite construir gráficos precisos y comparar visualmente diferentes categorías.

La figura también desarrolla el ejemplo del 75 %, mostrando que puede entenderse como la suma de tres sectores de 25 % cada uno. Al convertir esta proporción al gráfico circular, el resultado corresponde a un ángulo de 270°, dejando únicamente un cuarto del círculo sin colorear. Este ejemplo demuestra que los porcentajes pueden descomponerse en partes más sencillas para facilitar tanto los cálculos como el dibujo manual. Pensar un porcentaje como la suma de fracciones conocidas ayuda a construir gráficos con mayor rapidez y favorece una comprensión más intuitiva de las relaciones proporcionales entre los datos.

En muchas situaciones escolares es posible construir porcentajes sin calculadora utilizando divisiones sencillas del círculo. Si el círculo se divide primero en cuatro partes iguales, cada cuadrante representa 25 %. Si posteriormente cada cuadrante se divide en dos, se obtienen sectores de 12,5 %, equivalentes a 45°. A partir de estas divisiones pueden construirse fácilmente porcentajes como 12,5 %, 25 %, 37,5 %, 50 %, 62,5 %, 75 % y 87,5 %, simplemente combinando sectores ya conocidos. Esta estrategia resulta especialmente útil cuando se elaboran gráficos a mano durante actividades escolares o ejercicios de estadística básica.

En síntesis, los porcentajes constituyen una herramienta fundamental para representar información relativa y comunicar resultados de manera clara. Las distintas representaciones mostradas en la figura permiten comprender que un mismo dato puede expresarse mediante fracciones, decimales, porcentajes o gráficos, sin modificar su significado matemático. Entre ellas, el gráfico circular destaca porque transforma las proporciones en ángulos, facilitando la comparación visual entre categorías. Dominar estas conversiones fortalece el pensamiento estadístico, mejora la interpretación de gráficos y desarrolla habilidades esenciales para el análisis de datos en matemáticas, ciencias y muchas otras disciplinas.

Figura 9. [Un teorema de gráfico proporcional] convierte una probabilidad en un valor graficable. Se usa la probabilidad como fracción o decimal, nunca como porcentaje, y se multiplica por una constante de graficación. En un círculo, la constante es 360°; en una barra, puede ser la altura máxima elegida.

Ejemplo 1.  Dibujar un gráfico de torta sabiendo que la probabilidad de esferas rojas es del 20 %, de azules de 30% y de amarillas del 50 %.

Etapa analítica.

Usaremos

θi = 360° × Pi

Para calcular los ángulos aparentes, los ángulos verdaderos se obtienen sumando el ángulo aparente propio más en ángulo precedente.

Etapa numérica por álgebra simbólica.

Obtener la probabilidad racional.

Convertimos los porcentajes a fracciones moviendo el separador decimal dos posiciones a la izquierda: 0.2; 0.3; 0.5. Todo número precedido por 0. Es igual a ese número dividido entre 10. 2/10; 3/10; 5/10.

Ángulos aparentes.

θ(20%) = 360° × 2/10 = 36° × 2 = (60 + 12)° = 72°

θ(30%) = 360° × 3/10 = 36° × 3 = (90 + 18)° = 108°

θ(50%) = 360° × 5/10 = 36° × 5 = (150 + 30)° = 180°

Ángulos reales.

θ1 = θ(20%);   θ2 = θ(20%) + θ(30%) = 180°

El último siempre da 360°.

Teóricos vs experimentales

Algunas probabilidades pueden obtenerse de manera teórica, mediante modelos algebraicos que permiten hacer predicciones antes de observar los resultados reales. Otras, en cambio, son probabilidades experimentales, porque surgen de contar entidades producidas por un sistema real. En este segundo caso, no partimos solamente de una fórmula ideal, sino de datos medidos: contamos cuántos casos aparecen en cada categoría y luego calculamos qué proporción representa cada una dentro del total.

Un ejemplo clásico aparece en los experimentos de Gregor Mendel con la arveja Pisum sativum. En uno de sus cruces, Mendel obtuvo aproximadamente 705 plantas con flores moradas y 224 plantas con flores blancas. Estos valores experimentales podían compararse con distintas proporciones teóricas. Por ejemplo, una hipótesis podría predecir 50 % de flores moradas y 50 % de flores blancas; otra, en cambio, podría predecir 75 % de flores moradas y 25 % de flores blancas.

Al realizar los cálculos, se observa que los datos de Mendel no coinciden perfectamente con ninguna proporción ideal, porque los sistemas biológicos reales siempre muestran cierta variación. Sin embargo, la coincidencia con la proporción 75 % moradas y 25 % blancas es mucho más clara que con la proporción 50 % y 50 %. Esto permite descartar algunas hipótesis sobre la herencia y conservar otras como explicaciones más probables. Así, la estadística sirve para comparar datos experimentales con modelos teóricos y decidir cuál explicación se ajusta mejor a la realidad.

Figura 10. Las gráficas de barras dobles comparan valores experimentales y teóricos dentro de cada categoría. En la imagen, los datos observados se alejan de la hipótesis 50 % / 50 %, pero coinciden mejor con la hipótesis 75 % / 25 %. Sirven para evaluar visualmente modelos antes de aplicar pruebas estadísticas.

Referencias

Fisher, R. A. (1935). The design of experiments. Oliver & Boyd.

Freedman, D., Pisani, R., & Purves, R. (2007). Statistics (4th ed.). W. W. Norton & Company.

Mendel, G. (1866). Versuche über Pflanzen-Hybriden. Verhandlungen des Naturforschenden Vereins in Brünn, 4, 3–47.

Montgomery, D. C., & Runger, G. C. (2018). Applied statistics and probability for engineers (7th ed.). John Wiley & Sons.

Moore, D. S., McCabe, G. P., & Craig, B. A. (2017). Introduction to the practice of statistics (9th ed.). W. H. Freeman.

Nightingale, F. (1858). Notes on matters affecting the health, efficiency and hospital administration of the British Army. Harrison and Sons.

Ross, S. M. (2019). Introduction to probability and statistics for engineers and scientists (6th ed.). Academic Press.

Spiegel, M. R., Schiller, J., & Srinivasan, R. A. (2018). Schaum's outline of probability and statistics (5th ed.). McGraw-Hill Education.

Stigler, S. M. (1986). The history of statistics: The measurement of uncertainty before 1900. Harvard University Press.

Triola, M. F. (2022). Elementary statistics (14th ed.). Pearson.

Tufte, E. R. (2001). The visual display of quantitative information (2nd ed.). Graphics Press.

Upton, G., & Cook, I. (2014). A dictionary of statistics (3rd ed.). Oxford University Press.

Wild, C. J., & Seber, G. A. F. (2000). Chance encounters: A first course in data analysis and inference. John Wiley & Sons. 

No hay comentarios:

Publicar un comentario