Ingeniería de Datos Espaciales con Typescript

Espatial Data Engineering with Typescript

Foto de T K en Unsplash

Estableciendo tuberías de datos hacia la ciencia de datos espaciales automatizada

Introducción

Podemos pensar en los datos como si fueran agua y las empresas como pueblos. Así como un pueblo crece a medida que crece la población y necesita más agua para servir a sus residentes, una empresa, a medida que crece, requiere datos listos para consumir para respaldar sus operaciones. Dichas empresas requieren un sistema de tuberías de datos que actúe como las tuberías y la infraestructura que llevan agua a las casas en un pueblo. En nuestra analogía de datos, los ingenieros de datos son las personas que construyen y mantienen estas tuberías de datos. Es bastante sencillo para datos regulares en forma de array o tabla, sin embargo, es un poco más complicado cuando se trata de datos espaciales.

Los datos espaciales son un poco diferentes en comparación con los datos regulares; contienen atributos espaciales. Estos atributos nos permiten establecer una relación espacial, también conocida como topología geoespacial. Aunque dos tablas no tengan claves primarias y claves foráneas, aún podemos unirlas si ambas tienen los atributos espaciales. Si visualizamos el atributo espacial, ¡tenemos un mapa!

Ciencia de Datos Espaciales: Unión Espacial con SQL

unir las tablas si tienen una relación espacial. Bono: Lo estoy haciendo en Ms. Excel

towardsdatascience.com

La construcción de tuberías de datos espaciales difiere de la creación de tuberías de datos ordinarias. En este caso, manejamos principalmente atributos de datos espaciales utilizando SQL espacial, que es una habilidad menos común dentro de la comunidad de científicos de datos. Una vez que se construye una tubería de datos, los analistas de datos pueden proceder a analizar los datos espaciales provenientes de la tubería de datos. Esto significa que los analistas de datos pueden centrarse en generar ideas espaciales sin tener que preocuparse por la disponibilidad de los datos. Esto también significa que los mapas se pueden generar automáticamente con los últimos datos espaciales.

Este Artículo

Este artículo discute cómo construir tuberías de datos espaciales utilizando typescript y nodeJS. Podemos llamar a esto un proceso ETL (Extraer, Transformar, Cargar), pero con datos espaciales. Primero, analizaremos cómo podemos obtener los datos de la fuente utilizando typescript (Extraer). Luego, transformaremos estos datos en la estructura adecuada para su almacenamiento…