Distribución de Dirichlet La Intuición Subyacente y la Implementación en Python

Distribución de Dirichlet Intuición y Implementación en Python

Todo lo que necesitas saber sobre la distribución de Dirichlet

Fuente de la imagen: https://pixabay.com/vectors/cubes-dice-platonic-solids-numbers-160400/

La distribución de Dirichlet es una generalización de la distribución beta. En estadística bayesiana, se utiliza comúnmente como la prior conjugada de la distribución multinomial, por lo tanto, se puede utilizar para modelar la incertidumbre de un vector aleatorio de probabilidades. Tiene una amplia gama de aplicaciones que incluyen análisis bayesiano, minería de texto, genética estadística e inferencia no paramétrica. Este artículo ofrece una introducción intuitiva a la distribución de Dirichlet y muestra cómo está relacionada con la distribución multinomial. Además, muestra cómo se puede modelar y visualizar en Python.

Definición

Supongamos que las variables aleatorias continuas X₁, X₂, …Xₖ (k≥2) forman el vector aleatorio X definido como:

También definimos el vector α como:

donde

Ahora se dice que el vector aleatorio X tiene una distribución de Dirichlet con parámetro α si tiene la siguiente función de densidad conjunta:

La función B(α) se llama función beta multivariable y se define como

donde Г(x) es la función gamma. Si el vector aleatorio X tiene una distribución de Dirichlet con parámetro α, se denota por X ~ Dir(α). La función de densidad conjunta se incluye en la función de densidad conjunta para normalizarla. La función de densidad conjunta debe integrarse a 1 en su dominio:

Por lo tanto, tenemos:

Según la Ecuación 1, los valores que toman las variables aleatorias X₁, X₂, …Xₖ deben cumplir las siguientes condiciones para que f(x)>0:

Estas condiciones definen el soporte de la distribución de Dirichlet. El soporte de X, y de su distribución, es el conjunto de todos los x (los valores que puede tomar X) donde f(x)>0. Si X tiene k elementos, el soporte de X con una distribución de Dirichlet es un simplex de dimensión k-1. Un simplex es una variedad lineal acotada que se crea debido a las restricciones de la Ecuación 3. Un simplex es la generalización de la noción de un triángulo a dimensiones superiores. Por lo tanto, un k-1…