Más allá de la curva de campana una introducción a la distribución t

Introducción a la distribución t más allá de la curva de campana

Descubre los orígenes, teoría y usos detrás de la famosa distribución t

Foto de lil artsy: https://www.pexels.com/photo/person-about-to-catch-four-dices-1111597/

¿Qué es la distribución t?

La distribución t es una distribución de probabilidad continua que es muy similar a la distribución normal, sin embargo, tiene las siguientes diferencias clave:

  • Colas más pesadas: Una mayor porción de su masa de probabilidad se encuentra en los extremos (mayor curtosis). Esto significa que es más probable que produzca valores lejos de su media.
  • Un parámetro: La distribución t tiene solo un parámetro, los grados de libertad, ya que se utiliza cuando desconocemos la varianza de la población.

Un dato interesante sobre la distribución t es que a veces se le llama “distribución t de Student”. Esto se debe a que el inventor de la distribución, William Sealy Gosset, un estadístico inglés, la publicó utilizando su seudónimo “Student” para mantener su identidad anónima, lo que llevó al nombre “distribución t de Student”.

Teoría y Definición

Repasemos un poco la teoría detrás de la distribución para construir una intuición matemática.

Origen

El origen detrás de la distribución t proviene de la idea de modelar datos distribuidos normalmente sin conocer la varianza de esa población.

Por ejemplo, supongamos que muestreamos n puntos de datos de una distribución normal, entonces la media y la varianza de esta muestra serán respectivamente:

Donde:

  • es la media de la muestra.
  • s es la desviación estándar de la muestra.

Combinando las dos ecuaciones anteriores, podemos construir la siguiente variable aleatoria:

Aquí, μ es la media de la población y t es la estadística t que pertenece a la distribución t.

Mira aquí para una derivación más detallada.

Función de Densidad de Probabilidad

Como se mencionó anteriormente, la distribución t se parametriza con solo un valor, los grados de libertad, ν, y su función de densidad de probabilidad se ve así: