No uses Poisson
Porque esperanza = varianza
Una necesidad frecuente de la modelización probabilística tiene que ver con la incertidumbre sobre el número de ocurrencias de un evento de interés, en un lapso de tiempo dado. Por ejemplo, número de reclamaciones mensuales por siniestros cubiertos por pólizas de seguros, número de vehículos que llegan a una caseta de peaje en un horario y día de la semana, número de solicitudes de transacción que recibe una app bancaria por minuto, etc. Lo anterior es relevante para la toma de decisiones, particularmente las que tienen que ver con prevenir que el número de ocurrencias sobrepase la capacidad de atención, entre otras preocupaciones relevantes.
Como el número de ocurrencias es incierto, lo representamos por medio de una variable aleatoria (discreta) X que reportará algún valor del conjunto {0,1,2,…}, y requerimos una fórmula que, para cualquier número n de ocurrencias de un evento de interés, nos permita calcular la probabilidad P(X = n).
Aunque el valor que reporta X en cada ocasión es incierto, además de cuantificar dicha incertidumbre probabilísticamente, en dos publicaciones anteriores he discutido brevemente sobre dos aspectos fundamentales que interesan de cualquier variable aleatoria: su esperanza o valor esperado, denotado por E(X), y su variabilidad alrededor de E(X), que puede medirse de diversas formas, entre ellas la más popular es la varianza, denotada por V(X).
La esperanza E(X), cuando existe, es un número al que se va aproximando el promedio aritmético de una gran cantidad de observaciones de X. Como se trata de una aproximación, para cualquier valor n de observaciones de X interesa medir también qué tanto se alejan, en promedio, los valores que puede reportar X respecto a E(X), y una de las formas comunes para cuantificar variabilidad alrededor de E(X), es mediante V(X), entre otras alternativas.
Si, por ejemplo, X representa el número de vehículos por minuto que salen a carretera por una determinada caseta de peaje, los días viernes de 3:00 a 6:00 p.m, el número E(X) describe la afluencia promedio usual, pero ese número no me previene sobre situaciones atípicas que podrían ser preocupantes, consecuencia de la variabilidad de X, particularmente qué tanto puede alejarse X por arriba de E(X), porque esto podría provocar largas filas en dicha caseta de peaje, con las molestias y riesgos que esto representa.
Entonces, respecto a cualquier variable aleatoria nos interesa, al menos, cuantificar dos características fundamentales:
Tendencia central: Alrededor de qué valor usualmente reporta valores X, que puede ser E(X) o alguna otra propuesta (la mediana o la moda, de las que hablaré en otra ocasión).
Dispersión: Alguna medida de la variabilidad de X alrededor de su tendencia central, por ejemplo V(X), aunque existen otras alternativas ¡no te aferres a la varianza!
Para que un modelo probabilístico pueda representar con flexibilidad las dos características anteriores, requiere tener al menos dos parámetros, ya sea que cada parámetro represente alguna de estas características, o bien que de forma combinada distintos valores de ambos parámetros permitan representar distintos valores de tendencia central y dispersión.
Un modelo probabilístico con un solo parámetro no tiene el mínimo de flexibilidad mencionado, pues casi inevitablemente la tendencia central y la dispersión dependenden de un mismo valor del parámetro. Tal es el caso de uno de los modelos probabilísticos más populares para incertidumbre sobre conteos: el conocido como distribución de probabilidades Poisson:1
Al tener un solo parámetro b > 0, resulta que E(X) = b = V(X), esto es que solamente es válido cuando numéricamente su esperanza sea exactamente igual a su varianza, lo cual resulta un requerimiento absurdo, por dos simples razones:
La tendencia central y la variabilidad son dos aspectos distintos del comportamiento de una variable aleatoria, y para un mismo valor de tendencia central se puede tener mayor o menor variabilidad, no tienen por qué estar amarrados a ser numéricamente iguales.
Los valores numéricos E(X) y V(X) ni siquiera coinciden en unidades de medición, porque E(X), cuando existe, es un número en las mismas unidades de medición de X, y en cambio el número V(X), cuando existe, está en unidades al cuadrado de las originales (tengan o no sentido).
En la práctica, cuando se analizan datos observados de conteos, con frecuencia la varianza observada en los datos excede numéricamente al promedio aritmético de los datos, especialmente por el hecho de V(X) es un promedio de largo plazo de desviaciones cuadráticas de X respecto a E(X), y al estar elevando al cuadrado dichas desviaciones con facilidad se obtienen valores numéricos de la varianza que exceden a la esperanza y, por tanto, un modelo como el de Poisson resulta poco realista.
El comentario anterior es válido no solo para conteos y la popular distribución de probabilidades Poisson: En general, cualquier modelo probabilístico de una variable aleatoria que cuenta con un solo parámetro no debiera utilizarse en la práctica para representar fenómenos reales, porque no tiene la mínima flexibilidad para adaptarse a situaciones con distintos valores de tendencia central y dispersión. Existen muchos otros modelos probabilísticos de dos o más parámetros para conteos (Binomial, Binomial-Beta, Binomial-Negativa, Binomial-Negativa-Beta, Poisson-Gamma, etc.), e incluso se pueden construir nuevos discretizando modelos de variables aleatorias continuas de dos parámetros. ¡Ya no uses Poisson para conteos!
Siméon Denis Poisson (1781-1840) fue un matemático y físico francés. Su apellido significa «pez» en idioma francés.




¿Y en la práctica qué tan buenos resultados da el uso de la distribución de Poisson? ¿La usan las compañias de seguros? ¿Hay fenómenos que se modelan bien con esa distribución?