Crea un gráfico de planilla de perforación con Seaborn

Crea gráfico planilla perforación Seaborn

Un reloj de fichar con tarjetas de tiempo (imagen de Hennie Stander en UnSplash)

Un gráfico de tarjetas de fichar, también llamado gráfico de burbujas de tabla, es un tipo de visualización que resalta las tendencias cíclicas en los datos. Muestra los datos en una matriz o cuadrícula rígida, generalmente compuesta por días de la semana versus horas del día. Los círculos representan los puntos de datos en las intersecciones de las filas y columnas, y su tamaño transmite el valor de los datos. El color se puede utilizar para incluir información adicional.

Un gráfico de burbujas de tabla (imagen del autor)

El nombre “tarjeta de fichar” alude a las antiguas “tarjetas de tiempo” que los trabajadores estampaban o “fichaban” en una máquina para registrar sus entradas y salidas.

Para construir un gráfico de tarjetas de fichar, se necesitan datos con marcas de tiempo. En este proyecto de Ciencia de Datos de Éxito Rápido, utilizaremos un conjunto de datos de Kaggle para rastrear los momentos en que se alquilan bicicletas en Washington, D.C.

El Conjunto de Datos

El conjunto de datos de Kaggle “Bike Sharing in Washington D.C.” contiene el recuento por hora y por día de las bicicletas alquiladas en 2011 y 2012 en el sistema de bicicletas compartidas de la capital en Washington, D.C. [1]. Estos datos se han publicado bajo una licencia CC0 1.0. Para obtener más detalles sobre el contenido del conjunto de datos, visita el archivo README.

Por conveniencia, ya he descargado estos datos en un Gist público.

Instalando Librerías

Además de Python, necesitarás la biblioteca de análisis de datos pandas y la biblioteca de visualización seaborn. Puedes instalarlas con:

conda install pandas seaborn

o

pip install pandas seaborn

El Código

El siguiente código comentado fue escrito en JupyterLab y se describe por celda.

Importando Librerías y Cargando los Datos

Después de importar matplotlib y seaborn para la visualización, y pandas para el análisis de datos, leeremos el archivo CSV de datos de alquiler en un DataFrame de pandas, manteniendo solo las columnas para la estación del año, el día de la semana, la hora y el recuento (número de alquileres).