Conoce a los Becarios de Accenture 2023-24

La Iniciativa de Convergencia MIT y Accenture para la Industria y la Tecnología anuncia los becarios de posgrado 2023...

Una Intuición para AUC y C de Harrell

Todos los que se aventuran en el campo del aprendizaje automático o la modelización predictiva se encuentran con el c...

El Método de Captura y Recaptura

En este artículo, quiero presentar un método estadístico para estimar el tamaño de una población sin contarla complet...

Desequilibrio de Clases Desde el Sobremuestreo Aleatorio hasta ROSE

Últimamente, he estado desarrollando un paquete para abordar el desequilibrio de clases en Julia llamado Imbalance.jl...

Cómo utilizar el método de la bisección para la computación numérica

Un subcampo de la informática y las matemáticas conocido como cómputo numérico se enfoca en emplear métodos y algorit...

Desde el sobreajuste a la excelencia aprovechando el poder de la regularización

Cuando se trata de Aprendizaje Automático, nuestro objetivo es encontrar el modelo de ML que haga las mejores predicc...

Experimentos estadísticos con remuestreo

Permutación/arranque en pruebas de hipótesis A/B y estimación de potencia utilizando Python

Más allá de la predicción de la pérdida de clientes y el aumento de la retención

Una tarea muy común en la ciencia de datos es la predicción de la pérdida de clientes. Sin embargo, predecir la pérdi...

Estadísticas frecuentistas vs estadísticas bayesianas en la ciencia de datos

Introducción El análisis estadístico juega un papel crucial en el campo de la ciencia de datos en rápido desarrollo, ...

Evaluando Modelos de Incremento

Una de las aplicaciones más extendidas de la inferencia causal en la industria es el modelado de mejora, también cono...

Desentrañando la Ley de los Grandes Números

La Ley débil de los Grandes Números dice que la media de la muestra converge en probabilidad a la media de la poblaci...

Cómo evitar ser engañado por la precisión del modelo

Las métricas utilizadas para medir el rendimiento de los modelos de clasificación son bastante sencillas, al menos de...

Aplicando y utilizando la Distribución Normal para Ciencia de Datos

Una cosa que podría ser sumamente difícil al comenzar con la Ciencia de Datos es descubrir dónde exactamente comienza...

Entendiendo las pruebas A/B Comprende mejor con preguntas difíciles

Este artículo resalta errores estadísticos comunes en el contexto de experimentos. Está estructurado en cinco pregunt...

Diferencia entre Ciencia de Datos y Estadística

Introducción Con un aumento en las publicaciones para científicos de datos en Indeed en un 256%, la ciencia de datos ...

Desempaquetando la Cox Un Oscuro Secreto Oculto de la Regresión de Cox

Si has estado siguiendo mis publicaciones anteriores en el blog, quizás recuerdes que la regresión logística encuentr...

Análisis de varianza de dos vías en R

El ANOVA de dos vías (análisis de varianza) es un método estadístico que permite evaluar el efecto simultáneo de dos ...

Comprendiendo la Distribución Hipergeométrica

La distribución binomial es una distribución bien conocida dentro y fuera de la ciencia de datos. Sin embargo, ¿has o...

¿Cuál es la diferencia entre verosimilitud y probabilidad?

Probabilidad y verosimilitud son términos interrelacionados y a menudo confundidos que se utilizan comúnmente en la c...

Análisis de múltiples grupos en Modelado de Ecuaciones Estructurales

El análisis de múltiples grupos (MGA) es una técnica estadística que permite a los investigadores investigar las dife...

Pruebas de Bootstrap para Principiantes

En la Parte 1 de esta serie, presenté pruebas simples de rango y signo como introducción a las pruebas no paramétrica...