Más allá de la curva de campana una introducción a la distribución t
Introducción a la distribución t más allá de la curva de campana
Descubre los orígenes, teoría y usos detrás de la famosa distribución t

¿Qué es la distribución t?
La distribución t es una distribución de probabilidad continua que es muy similar a la distribución normal, sin embargo, tiene las siguientes diferencias clave:
- Colas más pesadas: Una mayor porción de su masa de probabilidad se encuentra en los extremos (mayor curtosis). Esto significa que es más probable que produzca valores lejos de su media.
- Un parámetro: La distribución t tiene solo un parámetro, los grados de libertad, ya que se utiliza cuando desconocemos la varianza de la población.
Un dato interesante sobre la distribución t es que a veces se le llama “distribución t de Student”. Esto se debe a que el inventor de la distribución, William Sealy Gosset, un estadístico inglés, la publicó utilizando su seudónimo “Student” para mantener su identidad anónima, lo que llevó al nombre “distribución t de Student”.
Teoría y Definición
Repasemos un poco la teoría detrás de la distribución para construir una intuición matemática.
Origen
El origen detrás de la distribución t proviene de la idea de modelar datos distribuidos normalmente sin conocer la varianza de esa población.
Por ejemplo, supongamos que muestreamos n puntos de datos de una distribución normal, entonces la media y la varianza de esta muestra serán respectivamente:
- Monitoreo de modelos de Machine Learning en producción ¿Por qué y c...
- Entendiendo a fondo las puntuaciones de AUC ¿Cuál es el punto?
- 10 Mejores Constructores de Sitios Web de IA
Donde:
- x̄ es la media de la muestra.
- s es la desviación estándar de la muestra.
Combinando las dos ecuaciones anteriores, podemos construir la siguiente variable aleatoria:
Aquí, μ es la media de la población y t es la estadística t que pertenece a la distribución t.
Mira aquí para una derivación más detallada.
Función de Densidad de Probabilidad
Como se mencionó anteriormente, la distribución t se parametriza con solo un valor, los grados de libertad, ν, y su función de densidad de probabilidad se ve así: