Cómo agilizar la comunicación en las tuberías de datos utilizando Mage
Acelerando la comunicación en tuberías de datos con Mage
Deja que el bot se encargue de las comunicaciones difíciles por nosotros
¿Alguna vez te has encontrado en una situación en la que tus tuberías de datos de aguas abajo se bloquean debido a un pequeño error manual en una de las hojas de Google? A veces, ni siquiera eres el propietario de la hoja, por lo que no puedes hacer nada más que perseguir al propietario de la hoja para que lo arregle. Mientras tanto, muchas otras tuberías críticas también están fallando como consecuencia, y también necesitas ocuparte de ellas.
Te sientes agotado y desgastado. La peor parte es que no hay mucho que puedas hacer como ingeniero. Todo se trata de comunicación interminable y gestión de interesados. El problema de la hoja de Google es solo un ejemplo de problemas de origen que pueden ocurrir en diversas escalas. Tómate un momento para reflexionar sobre un problema que resuene contigo mientras profundizamos en el artículo.
Una clave para mejorar esta situación es automatizar el ciclo de vida de la comunicación dentro de tus tuberías de datos. Si tu tubería tiene un mecanismo de alerta implementado, entonces ya es un buen comienzo. Sin embargo, las alertas se dirigen principalmente a los equipos de ingeniería de datos en lugar de a los equipos externos.
Según mi experiencia, también es igualmente vital establecer una comunicación proactiva con el equipo de origen o los usuarios finales para asegurarse de que estén bien informados sobre las situaciones en curso y puedan tomar medidas en consecuencia. A lo largo de este artículo, utilizaré Mage para la implementación, una alternativa moderna a Airflow conocida por sus características efectivas para resolver este tipo de problemas.
Comunicación automatizada
Una de las misiones de los ingenieros es automatizar las cosas. Nos ahorra tiempo para el futuro y es divertido. A nadie le gusta perseguir continuamente al equipo de origen para solucionar problemas de datos o explicar individualmente qué sucedió a los usuarios finales cuando las cosas no funcionan. En su lugar, dejaríamos que un bot lo haga por nosotros. Hay dos niveles de automatización que podemos implementar:
- El xAI de Elon Musk se enfrenta al ChatGPT de OpenAI
- Aprendizaje automático de efectos mixtos para variables categóricas...
- Haciendo currículums más inteligentes Herramientas impulsadas por I...
Comentarios inmediatos al equipo de origen de datos — En lugar de informar manualmente al equipo de origen sobre el problema de datos, se puede establecer una forma automatizada y consistente de comunicación a través de un bot. Cada vez que falla una prueba de datos, se activará una función tipo llamada de retorno para notificar al equipo de origen por correo electrónico o Slack, proporcionándoles detalles sobre las razones de…