Análisis exploratorio de datos en Google Sheets
Análisis datos en Google Sheets
Comparando el Enfoque de Google Sheets y Pandas

Siempre es bueno procesar los datos utilizando herramientas modernas como Pandas o Jupyter. Pero imaginemos el caso en el que un colega o amigo nos pide hacer un análisis de datos, pero él o ella no es una persona técnica, no utiliza Python ni Jupyter, y no tiene una cuenta en Tableau, Power BI o cualquier otro servicio sofisticado (pero, lamentablemente, no gratuito). En este caso, procesar los datos en Google Sheets puede ser una buena solución alternativa por varias razones:
- Google es utilizado en todo el mundo; al momento de escribir este artículo, más de 1.800 millones de usuarios tienen una cuenta de Google. Prácticamente todo el mundo tiene una cuenta de Google hoy en día, y compartir documentos será extremadamente fácil.
- El ecosistema de Google es seguro. Soporta autenticación de dos factores y estándares de seguridad modernos, e incluso se pueden compartir conjuntos de datos privados entre grupos limitados de personas.
- Por último pero no menos importante, la solución es gratuita y no requiere costos adicionales. Y como bono adicional, Google Sheets funciona en el navegador, no requiere instalar ningún software y puede funcionar en cualquier plataforma como Windows, Linux, OSX o incluso en un teléfono inteligente.
En este artículo, realizaré un análisis de datos exploratorio básico en Pandas, luego repetiremos este proceso en Google Sheets y veremos cómo funciona.
Fuente de Datos
Para hacer las cosas más divertidas, usemos un conjunto de datos real. Crearemos una herramienta para calcular la energía generada por paneles solares. Para ello, utilizaré los datos de PVGIS (Sistema de Información Geográfica Fotovoltaica de la Comisión Europea), a los que se puede acceder de forma gratuita a través de esta URL (Licencia CC BY 4.0):

Utilizando esta página, podemos descargar datos de irradiación solar, lo que nos permitirá calcular la generación de energía. Como se puede ver en la captura de pantalla, podemos seleccionar datos horarios para diferentes años y ubicaciones. Después de descargar los datos, los utilizaremos en Pandas.
EDA en Pandas
Comencemos con el análisis exploratorio de datos (EDA) en Pandas. Siempre es más fácil…