7 formas de crear una matriz de correlación en Python
7 formas de crear una matriz de correlación en Python
¡No seas el científico de datos que siempre lanza la misma matriz de correlación!
Seamos honestos, la matriz de correlación básica es aburrida. Lo mismo ocurre con el popular pairplot. Útil, pero aburrido. No es que odie los postres de vainilla 🍦 🍨 🍦 🍨 🍦
Si estás de acuerdo, este artículo es para ti, te ayudará a mejorar y diversificar tu juego de matrices de correlación.
Las matrices de correlación son herramientas fundamentales para el análisis de datos. Nos permiten entender cómo se relacionan diferentes variables entre sí. Aquí hay diez métodos para crear una matriz de correlación en Python, utilizando varias bibliotecas y conjuntos de datos.
1) Usando Pandas
Quizás la opción más simple. Esta es una opción simple porque solo requiere un método simple en cualquier objeto DataFrame de Pandas. Dado que la mayoría de nosotros en ciencia de datos utilizamos Pandas para nuestros datos, esta suele ser una de las formas más rápidas y fáciles de inspeccionar las correlaciones de tus datos.
import pandas as pdimport seaborn as snsdata = sns.load_dataset('mpg')correlation_matrix = data.corr(numeric_only=True)correlation_matrix

Puede que te estés preguntando “¿dónde están los valores p?” Si lo estás (como yo cuando veo esta salida), lee hasta el final de este artículo para obtener consejos sobre cómo también informar esos valores p.
- Optimizar las cargas de trabajo de IA generativa para la sostenibil...
- Cómo United Airlines construyó un canal de aprendizaje activo de re...
- El CEO de NVIDIA, Jensen Huang, será el protagonista de la Cumbre d...
2) Usando NumPy
Cuando solo necesitas o quieres una matriz y no necesitas etiquetas de columna o fila.
import seaborn as snsdata = sns.load_dataset('mpg')correlation_matrix = data.corr()sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
Obtendrás un resultado similar al siguiente.
array([[ 1. , -0.8051, -0.7784, -0.8322, 0.4233], [-0.8051, 1. , 0.8972, 0.9329, -0.5438], [-0.7784, 0.8972, 1. , 0.86453, -0.6891], [-0.8322, 0.9329, 0.86453, 1. , -0.4168], [ 0.4233, -0.5438, -0.6891, -0.4168, 1. ]])