Distribución de Poisson: guía completa para entender y aplicar la distribución de Poisson

Qué es la distribución de Poisson

La distribución de Poisson es una ley de probabilidad discreta que describe la probabilidad de que ocurran un número determinado de eventos en un intervalo fijo de tiempo, espacio o influencia, bajo tres condiciones clave: que los eventos sean raros, que se produzcan de forma independiente entre sí y que la tasa de ocurrencias por unidad sea constante. En español, solemos decir “distribución de Poisson” para referirnos a esta familia de probabilidades, cuyo nombre homenajea al matemático francés Siméon Denis Poisson.

Si X es una variable aleatoria que sigue una distribución de Poisson con parámetro λ > 0, la probabilidad de observar exactamente k eventos en el intervalo dado es

P(X = k) = e^(-λ) · λ^k / k!, para k = 0, 1, 2, …

En este contexto, λ representa la tasa promedio de ocurrencias por unidad de intervalo. Por ejemplo, si en una central telefónica llegan en promedio 3 llamadas por minuto, λ = 3 para ese intervalo de tiempo, y X cuenta las llamadas recibidas en ese minuto.

Propiedades fundamentales de la distribución de Poisson

Parámetro λ y significado práctico

El parámetro λ es la tasa de ocurrencia esperada en el intervalo de interés. En una distribución de Poisson, la esperanza matemática (media) es E[X] = λy la varianza es Var(X) = λ. Esto implica que, a mayor λ, la distribución se desplaza hacia números mayores de eventos y se vuelve más dispersa.

Momento y función de masa

Además de su PMF, la distribución de Poisson tiene momentos que permiten construir aproximaciones y estimaciones. El momento generador de momentos (MGF) de X es M_X(t) = exp(λ (e^t − 1)). Este recurso resulta útil para demostrar propiedades y para trabajar con sumas de variables Poisson.

Propiedades de suma e independencia

Si X1, X2, …, Xn son variables aleatorias independientes, cada una con distribución de Poisson con parámetros λ1, λ2, …, λn, entonces la suma X = X1 + X2 + … + Xn sigue una distribución de Poisson con parámetro λ = λ1 + λ2 + … + λn. Esta propiedad facilita el modelado de múltiples fuentes de eventos independientes que se acumulan en un mismo intervalo.

Relación entre la distribución de Poisson y otras distribuciones

Convergencia desde la binomial

La distribución de Poisson puede surgir como límite de la distribución binomial cuando el tamaño de la muestra n crece sin límite y la probabilidad de éxito p se hace pequeña de forma que λ = n p permanezca constante. En ese caso, si X ~ Binomial(n, p) con λ = n p, entonces X converge en distribución a Poisson(λ). Esta relación es clave para entender por qué la Poisson aparece como modelo de recuentos en intervalos cortos con eventos raros.

Relación con la distribución binomial negativa y otros modelos de conteo

La distribución de Poisson comparte con otras leyes de conteo ciertas características, pero cada una tiene supuestos diferentes. Por ejemplo, la binomial negativa se utiliza para conteos de ensayos independientes hasta el k-ésimo fracaso, y la Poisson se asocia más a recuentos de eventos en intervalos fijos cuando la tasa es estable. En la práctica, la Poisson a menudo se utiliza como una aproximación o un modelo base para datos de conteos cuando las condiciones de independencia y tasa constante se cumplen razonablemente.

Aplicaciones prácticas de la distribución de Poisson

La distribución de Poisson aparece en una amplia variedad de dominios, especialmente en áreas donde se cuentan eventos discretos en intervalos fijos. Algunas aplicaciones habituales incluyen:

Modelar llamadas recibidas por un centro de atención al cliente por minuto o por hora.
Conteo de defectos en un proceso de fabricación dentro de una unidad de longitud o de tiempo.
Llegadas de clientes a una tienda, flujos de tráfico en un punto de control o de peajes en un tramo vial.
Eventos raros en genética, como mutaciones en un gen por unidad de muestra.
Incidencia de fallos en sistemas tecnológicos, por ejemplo, errores en una red durante un intervalo de observación.

En cada caso, λ representa la tasa esperada de ocurrencias y permite calcular la probabilidad de observar un número específico de eventos dentro del intervalo analizado. Esta versatilidad ha hecho de la distribución de Poisson una herramienta fundamental en ingeniería, economía, epidemiología y ciencias de datos.

Cálculo práctico: ejemplos y ejercicios resueltos

Para entender mejor la distribución de Poisson, observe algunos ejemplos numéricos con λ específico:

Ejemplo 1: probabilidad de cero eventos

Si λ = 4, la probabilidad de no observar ningún evento en el intervalo es P(X = 0) = e^(-4) ≈ 0.0183 (o 1.83%).

Ejemplo 2: probabilidad de dos eventos

Con λ = 4, P(X = 2) = e^(-4) · 4^2 / 2! = e^(-4) · 16 / 2 ≈ 0.0733 (aproximadamente 7.33%).

Ejemplo 3: expectativa de ocurrencias en intervalo

Si el objetivo es estimar la probabilidad de que ocurran entre 3 y 5 eventos cuando λ = 4, calcule P(3 ≤ X ≤ 5) sumando las probabilidades P(X = 3), P(X = 4) y P(X = 5) usando la fórmula de la PMF y el valor de λ.

¿Qué pasa con intervalos más largos o más cortos?

La distribución de Poisson es estable frente a cambios en el tamaño del intervalo cuando la tasa por unidad es constante. Si se duplica la longitud del intervalo, la tasa total será aproximadamente el doble, es decir λ → 2λ, y las probabilidades de conteos altos aumentarán de forma correspondiente. Este comportamiento facilita comparaciones entre períodos diferentes y facilita la extrapolación de escenarios de demanda o de incidentes.

Estimación de λ y construcción de intervalos de confianza

Estimación por máxima verosimilitud

Si se observan n intervalos independientes y se cuentan los eventos en cada uno, la estimación de λ que maximiza la verosimilitud es simplemente la media de los recuentos observados: λ̂ = (1/n) Σ X_i. Este estimador es insesgado y consistente para la distribución de Poisson.

Intervalos de confianza

Para intervalos de confianza sobre λ, se pueden usar enfoques exactos basados en la Poisson o aproximaciones asintóticas. Por grandes muestras, la distribución muestral de la media de recuentos se aproxima por una distribución normal con media λ y varianza λ/n. En escenarios con muestras pequeñas, conviene emplear métodos exactos o basados en la distribución Poisson de la suma para construir intervalos de confianza precisos.

Convergencia y límite: cuándo la Poisson es una buena aproximación

La distribución de Poisson resulta especialmente útil cuando se cumplen condiciones de rareza de eventos y de independencia. En la práctica, se utiliza como aproximación para modelar recuentos en sistemas Bin(n, p) con n grande y p pequeño, siempre que λ = n p se mantenga moderado. Esta propiedad de límite hace que la Poisson sea un modelo robusto para recuentos de incidencias en intervalos cortos, donde los eventos son raros y las ocurrencias independientes entre sí.

Errores comunes y buenas prácticas al usar la distribución de Poisson

No asumir independencia cuando los eventos están correlacionados; la Poisson requiere eventos independientes entre sí dentro del mismo intervalo.
Utilizar λ variable sin actualizarla cuando cambian las condiciones o la duración del intervalo analizado.
Tratar de forzar la Poisson para datos de conteos con sobre-dispersión o sub-dispersión; en esos casos pueden ser más apropiadas otras distribuciones (por ejemplo, negativa binomial para sobre-dispersión).
Cuando el conteo máximo observado es pequeño, la Poisson puede ajustar bien, pero para conteos muy altos conviene verificar si la aproximación sigue siendo razonable.

Buenas prácticas: revisar la bondad de ajuste mediante pruebas estadísticas o gráficos de probabilidad acumulada (Q-Q) para confirmar que el modelo Poisson describe de forma adecuada los datos. Si la varianza observada es significativamente distinta de la media, considerar modelos alternativos o incorporar heterogeneidad entre subpoblaciones para explicar la variación.

Herramientas y recursos para trabajar con la distribución de Poisson

La distribución de Poisson está implementada en la mayoría de paquetes estadísticos y lenguajes de programación. Algunas herramientas útiles incluyen:

R: funciones dpois, ppois, qpois y rpois para densidad, distribución acumulada, cuantiles y generación de números aleatorios.
Python (SciPy): scipy.stats.poisson ofrece métodos para PMF, CDF, percentiles y simulación.
Excel: funciones POISSON.DIST y POISSON para cálculos de probabilidades y acumuladas (en algunas versiones se encuentran como POISSON).
Calculadoras en línea: útiles para rápidos cálculos de P(X = k) o P(X ≤ k) con λ fijo.

Elige la herramienta con la que te sientas más cómodo y valida siempre tus resultados con ejemplos numéricos para evitar errores de interpretación.

Resumen práctico y conclusiones sobre la distribución de Poisson

La distribución de Poisson es un modelo clásico para conteos de eventos discretos en intervalos fijos, con una tasa constante y eventos independientes. Su fórmula sencilla de P(X = k) = e^(-λ) λ^k / k! permite calcular rápidamente probabilidades puntuales y, gracias a su propiedad de suma, facilita el modelado de varias fuentes de eventos. Su relación de límite con la distribución binomial la convierte en una herramienta poderosa cuando se estudian procesos de llegada o defectos en sistemas de operación real. Al trabajar con datos de conteo, es importante confirmar la adecuación del modelo Poisson y considerar alternativas si la varianza difiere notablemente de la media. En definitiva, la distribución de Poisson continúa siendo una base sólida para el análisis de recuentos en estadística y ciencia de datos.