Variables aleatorias continuas
De hecho, absolutamente continuas
En una publicación anterior abordé de forma general el concepto de variable aleatoria, aunque el ejemplo proporcionado en realidad fue de un tipo particular (discreto), así que ahora escribo sobre variables aleatorias continuas.
La palabra discreto viene del latín discretus, pasado participio de discernere, que significa separar, distinguir o apartar. En latín clásico discretus ya se usaba con el sentido de separado o distinto, contrastando con continuus (unido, sin interrupciones), del verbo continere (mantener junto).
Recordemos que una variable aleatoria X es, en general, una cuantificación de ciertos aspectos derivados de los resultados inciertos de un fenómeno o experimento aleatorio. Al conjunto de valores posibles que puede reportar X lo denominamos rango de la variable aleatoria, y lo denotamos Ran X. Si el conjunto de valores en Ran X son números claramente separados entre sí, y se pueden enumerar, decimos que X es una variable aleatoria discreta.
En tal caso, para realizar cálculo de probabilidades con una variable aleatoria discreta, basta poder deducir o aproximar una fórmula general para calcular probabilidades puntuales P(X = x) para cualquier x elemento de Ran X, y a dicha fórmula se denomina función de masa de probabilidades.
Cuando el conjunto de valores Ran X corresponde a una infinidad no numerable de valores posibles, informalmente entendiendo por “no numerable” que los distintos valores están muy juntos unos de otros (continuus), como ocurre en un intervalo de números reales (acotado o no), existen varios tipos, del cual solo discutiré el correspondiente al de variable aleatoria continua.1
Un ejemplo ilustrativo sería el caso de la estatura resultante de una persona adulta seleccionada al azar en una determinada población. No existe un conjunto finito, ni siquiera infinito numerable, de estaturas distintas posibles, ya que, en principio, cualquier número real positivo podría ser. En cuanto a un intervalo de valores entre una estatura mínima y una máxima posible en adultos, tampoco se tiene claridad científica al respecto. Solo tenemos referencias históricas en las que se ha documentado una estatura mínima verificada, hasta el momento, de aproximadamente 0.55 metros, y una estatura máxima, hasta el momento, de 2.72 metros.
Pero aun si tomáramos como válido que toda estatura necesariamente se encuentra en el intervalo de 0.55 a 2.72 metros, entre dichos valores existe una infinidad no numerable de estaturas posibles. Y así como no existen personas con exactamente las mismas huellas digitales, así sean gemelas, tampoco existen dos personas con exactamente la misma estatura.
Que dos personas reporten medir, por ejemplo, 1.72 metros, es una coincidencia por redondeo del instrumento de medición que solo llega hasta centímetros, pero con una mayor precisión (milímetros o más pequeño) seguro que miden algo distinto. De hecho, la probabilidad teórica de que la estatura exacta de una persona sea igual a un número racional2 es cero, esto es, con probabilidad 100% tu verdadera estatura ¡es un número irracional!3 Nunca podrás medirla de forma exacta porque no tenemos instrumentos de precisión infinita.
Entonces, cuando una persona reporta que mide 1.72 metros de estatura, en realidad está reportando, implícitamente, que su estatura se encuentra en el intervalo que va de 1.715 metros hasta antes de 1.725 metros, mismo que denotamos [1.715,1.725), y el valor 1.72 es el punto medio de dicho intervalo, elegido arbitrariamente como representante del mismo.
Con variables aleatorias continuas lo que tiene sentido preguntarse es sobre la probabilidad de que reporten un valor que pertenezca a un intervalo de interés, esto es, sobre cómo calcular cosas como P(a < X < b) para cualesquiera valores a y b.
Volviendo a la idea de una variable aleatoria continua X que represente la estatura (en metros) de personas adultas elegidas al azar dentro de una determinada población, si medimos a 200 personas obtendríamos una serie de mediciones que podrían verse como: 1.57, 1.73, 1.66, 1.81, 1.61, etc. Quizás con algunos valores repetidos por efecto del redondeo derivado de la limitación de precisión de nuestro instrumento de medición, que solo llega hasta centímetros. Luego podemos definir arbitrariamente intervalos de interés, y contar cuántas personas (frecuencia) caen en cada intervalo, y tabularlo. Por ejemplo:
El porcentaje de personas que caen en cada intervalo4 representa una aproximación empírica de la probabilidad de que una persona elegida al azar en esa población resulte con una estatura en cada intervalo. Así, por ejemplo, 30.5% sería (aproximadamente) la probabilidad de que un persona resulte con estatura mayor a 1.705 y no más de 1.805 metros, que escribimos como P(1.705 < X ≤ 1.805) = 0.305. La tabla anterior puede visualizarse mediante una gráfica de barras, conocida como histograma de frecuencias:
Mediante un sencillo ajuste a los datos anteriores, podemos hacer que las áreas de las barras (rectángulos amarillos) coincidan con los porcentajes observados. En este caso, como los intervalos de estaturas son de longitud 0.1 metros, que es la medida de la base de cada barra o rectángulo, multiplicando por el total de alturas que es 200 obtenemos 0.1×200=20, por lo que dividiendo entre 20 los conteos, obtenemos “conteos ajustados” que logran el objetivo deseado:
Por ejemplo, para estaturas entre 1.70 y 1.80, el “conteo” ajustado es 3.05, que es la altura de la barra o rectángulo con medida de la base 1.80-1.70=0.1, por lo que su área es 0.1×3.05=0.305, o equivalentemente 30.5%, como se buscaba.
Y es aquí donde las matemáticas hacen su magia, y nos proporcionan diversas alternativas de funciones que pueden aproximar el comportamiento anterior, mismas que se denominan funciones de densidad de probabilidades, y cuya área sobre cualquier intervalo de interés nos proporciona la probabilidad de que una persona elegida al azar en dicha población tenga una estatura que pertence a dicho intervalo.
La curva roja representa una función de densidad de probabilidades f de una variable aleatoria continua X, con la cual hay que calcular el área que encierra sobre un intervalo de interés [a,b] para calcular la probabilidad de que X reporte un valor en dicho intervalo, lo cual es posible mediante cálculo integral:
Así que el cálculo de probabilidades con variables aleatorias (absolutamente) continuas se circunscribe esencialmente a deducir, o estimar con base en datos observados, la función de densidad de probabilidades. Existe ya un amplio catálogo de funciones paramétricas distintas para probar o adaptar. Y hago énfasis en AMPLIO porque en la práctica se abusa muchísimo de un solo modelo particular que se pretende utilizar casi para todo: la función de densidad gaussiana5, también conocida como Normal, de la cual hablaremos, y la criticaremos, en otra ocasión.
De hecho, la explicación es sobre variables aleatorias absolutamente continuas, pero la justificación de “absolutamente” es una tanto técnica como para discutirla en términos informales, porque existen variables aleatorias singularmente continuas, que son más de interés teórico que práctico.
Un número racional es aquel que puede expresarse como el cociente de dos números enteros. Por ejemplo, 1.72 = 172/100, o bien 2/11 = 0.18181818… Esto es, un número racional tiene una expansión decimal finita, o infinita periódica (con un patrón que se repite). En cambio, un número irracional tiene una expansión decimal infinita no periódica, como el caso del famoso número π.
Esto se debe a que, con distribución de probabilidad continua uniforme sobre cualquier intervalo acotado de números reales (sin considerar el caso de un punto aislado {r}=[r,r]]), se puede demostrar formalmente que la probabilidad del conjunto de números irracionales en dicho intervalo es 1.
Aunque en la tabla estamos redondeando hasta centímetros, en realidad un intervalo indicado como 1.61-1.70 debe entenderse como 1.605-1.7049999999… y, por tanto, son intervalos de longitud 0.10, y no 0.09 metros.
En honor a Johann Carl Friedrich Gauss (1777-1855), destacadísimo científico alemán, con grandes aportaciones en diversas ciencias.








