Construyendo una matriz de correlación con valores de p en Python

Crear una matriz de correlación con valores p en Python

Produciendo resultados de correlación más allá de los valores predeterminados en Python

Resumen

Si eres un fanático de la matriz de correlación, como yo, este artículo es para ti. Este artículo está especialmente dirigido a personas que utilizan Python para generar, mostrar y analizar matrices de correlación. Además, este artículo está dirigido a personas que, al igual que yo, quizás provengan de otras herramientas de análisis estadístico y que hayan sido mimados con resultados más extensos e informativos de los que normalmente se encuentran en Python.

A continuación, te muestro cómo me imagino cuando estoy enojado y frustrado porque las herramientas predeterminadas en Python no me tratan tan bien como algunas de las otras herramientas de análisis estadístico que aprendí al principio de mi carrera.

Foto de Julien L en Unsplash

Por ejemplo, anteriormente he escrito sobre la falta de resultados que los usuarios de Stata están acostumbrados a ver al fusionar archivos de datos. Si has encontrado este artículo y no estás 100% seguro de qué es exactamente una matriz de correlación, déjame explicártelo.

Matrices de correlación en la práctica

Una matriz de correlación es una tabla que muestra los coeficientes de correlación entre variables. Cada celda de la tabla muestra la correlación entre dos variables, mientras que la diagonal representa la correlación de una variable consigo misma, que siempre es 1. Los valores en la matriz varían entre -1 y 1. Una correlación de 1 indica una relación positiva perfecta, una correlación de -1 indica una relación negativa perfecta y una correlación de 0 indica que no hay relación entre las dos variables. Las matrices de correlación se utilizan ampliamente en análisis estadísticos para evaluar las relaciones lineales entre variables y determinar las variables que están más fuertemente relacionadas entre sí.

Así es como suele aparecer una matriz de correlación.

Crédito de imagen: Tabla del autor en la publicación del autor.

Interpretando Matrices de Correlación

Para fines de discusión, he resaltado la cuarta fila en la tabla anterior con un recuadro rojo. Dentro de este recuadro rojo, los resultados muestran la relación entre la edad y tres medidas de resultado, incluyendo…