Distribución de Dirichlet La Intuición Subyacente y la Implementación en Python
Distribución de Dirichlet Intuición y Implementación en Python
Todo lo que necesitas saber sobre la distribución de Dirichlet

La distribución de Dirichlet es una generalización de la distribución beta. En estadística bayesiana, se utiliza comúnmente como la prior conjugada de la distribución multinomial, por lo tanto, se puede utilizar para modelar la incertidumbre de un vector aleatorio de probabilidades. Tiene una amplia gama de aplicaciones que incluyen análisis bayesiano, minería de texto, genética estadística e inferencia no paramétrica. Este artículo ofrece una introducción intuitiva a la distribución de Dirichlet y muestra cómo está relacionada con la distribución multinomial. Además, muestra cómo se puede modelar y visualizar en Python.
Definición
Supongamos que las variables aleatorias continuas X₁, X₂, …Xₖ (k≥2) forman el vector aleatorio X definido como:
También definimos el vector α como:
donde
- Conoce el modelo de IA RT-2 de Google un robot que aprende como un ...
- Aprovechando el aprendizaje automático en Big Data con PySpark en AWS
- La Revolución de la IA Explorando Aplicaciones y Casos de Uso en la...
Ahora se dice que el vector aleatorio X tiene una distribución de Dirichlet con parámetro α si tiene la siguiente función de densidad conjunta:
La función B(α) se llama función beta multivariable y se define como
donde Г(x) es la función gamma. Si el vector aleatorio X tiene una distribución de Dirichlet con parámetro α, se denota por X ~ Dir(α). La función de densidad conjunta se incluye en la función de densidad conjunta para normalizarla. La función de densidad conjunta debe integrarse a 1 en su dominio:
Por lo tanto, tenemos:
Según la Ecuación 1, los valores que toman las variables aleatorias X₁, X₂, …Xₖ deben cumplir las siguientes condiciones para que fₓ(x)>0:
Estas condiciones definen el soporte de la distribución de Dirichlet. El soporte de X, y de su distribución, es el conjunto de todos los x (los valores que puede tomar X) donde fₓ(x)>0. Si X tiene k elementos, el soporte de X con una distribución de Dirichlet es un simplex de dimensión k-1. Un simplex es una variedad lineal acotada que se crea debido a las restricciones de la Ecuación 3. Un simplex es la generalización de la noción de un triángulo a dimensiones superiores. Por lo tanto, un k-1…