Cómo crear un mapa de calor de calidad de publicación en Python
Crear mapa de calor calidad publicación Python
Una guía tutorial sobre mapas de calor en Python
Introducción
Los mapas de calor se pueden utilizar como figuras informativas para transmitir datos cuantitativos. Se pueden utilizar para transmitir datos de manera fácil de leer, proporcionando un resumen conciso de los datos.
Python tiene varias herramientas para facilitar la producción de mapas de calor de calidad para publicaciones. Estas incluyen las bibliotecas Seaborn y Matplotlib, además de las bibliotecas subplot2grid, que pueden proporcionar una forma conveniente de organizar datos en un mapa de calor.
En este tutorial, detallaré los pasos necesarios para producir un mapa de calor que se centre en la presencia/ausencia de elementos clave. Para hacer esto, utilizaré un archivo CSV que contiene datos ficticios sobre una selección de aislamientos bacterianos. Estas cepas bacterianas tienen varias características, incluyendo genes de resistencia a los antibióticos, genes de virulencia y ciertos tipos de cápsulas. Un mapa de calor permitirá la inspección rápida y la comparación entre las diferentes cepas.
Aunque el ejemplo utilizado se centra en cepas bacterianas, las técnicas aplicadas se pueden utilizar de manera más amplia para otros conjuntos de datos para ayudar a visualizar los datos utilizando un mapa de calor. A lo largo del siguiente tutorial, todas las imágenes son del autor.
- Prueba estas 3 funciones menos conocidas de Pandas
- Inteligencia Artificial Responsable en Google Research Equidad en l...
- La IA lleva al compañero de ala robot a los combates aéreos
Objetivo
Crear un mapa de calor de calidad para publicaciones que muestre la presencia/ausencia de genes clave de cepas bacterianas ficticias.
Este tutorial utilizará el siguiente archivo CSV, ‘Bacterial_strain_heatmap_tutorial_data.csv’, disponible en el repositorio de Github.
Comenzando
Para empezar, se necesitan algunas importaciones para leer los datos y dar estilo a la figura más tarde. Comenzaremos incluyendo todas las declaraciones de importación juntas.
import pandas as pd import numpy as npimport matplotlib.pyplot as plt from matplotlib.colors import ListedColormapimport seaborn as sns from matplotlib.patches import Patchfrom matplotlib.lines import Line2Dfrom matplotlib.patches import Rectangle
A continuación, leemos el dataframe, establecemos el índice utilizando la columna ‘Strain’ y visualizamos las primeras 5 filas.
df = pd.read_csv('Bacterial_strain_heatmap_tutorial_data.csv').set_index('Strain')…