Las 3 habilidades de SQL más importantes para pasar a la siguiente ronda

3 habilidades SQL clave para avanzar

Ayuda para Entrevistas Técnicas para Profesionales de Datos

Crédito de la imagen: Arnold Francisa en Unsplash

Si aspiras y estás entrevistando actualmente para roles como científico de datos, analista de datos e ingeniero de datos, es probable que te encuentres con una o más entrevistas técnicas que requieran codificación en vivo, generalmente involucrando SQL. Si bien las entrevistas posteriores pueden requerir diferentes lenguajes de programación como Python, que es común en el ámbito de datos, centrémonos en las preguntas típicas de SQL que he encontrado durante estas entrevistas. Para fines de esta discusión, asumiré que ya estás familiarizado/a con conceptos fundamentales de SQL como SELECT, FROM, WHERE, así como funciones de agregado como SUM y COUNT. ¡Vamos a los detalles!

1. Dominando los Joins y Tipos de Tablas

Sin lugar a dudas, la pregunta de SQL más común es sobre los joins de tablas. Puede parecer demasiado obvio, pero todas las entrevistas en las que he participado se han centrado en este tema. Deberías sentirte cómodo/a con los inner joins y left joins. Además, la habilidad para manejar self-joins y unions es valiosa. Igualmente importante es la capacidad para ejecutar estos joins en diferentes tipos de tablas, especialmente en tablas de tipo fact y dimension. Aquí están mis definiciones generales para estos dos términos:

Tabla Fact: Una tabla que contiene numerosas filas pero relativamente pocas atributos o columnas. Imagina un ejemplo donde un minorista en línea mantiene una tabla de “pedidos” con columnas como: fecha, id_cliente, id_pedido, id_producto, unidades, monto. Esta tabla tiene pocos atributos pero contiene un gran volumen de registros.

Tabla Dimensión: Una tabla dimensional con menos filas pero muchos atributos. Por ejemplo, la tabla de “clientes” del mismo minorista en línea podría tener una fila por cliente, con atributos como id_cliente, nombre, apellido, dirección_envío, código_postal_envío y más.

Entender estos dos tipos principales de tablas es importante. Es crucial comprender por qué y cómo combinar las tablas fact y dimension para garantizar resultados precisos. Consideremos un ejemplo del mundo real: la pregunta de la entrevista presenta dos tablas (“pedidos” y “cliente”) y pregunta:

¿Cuántos clientes han comprado al menos 3 unidades en su vida y tienen un código postal de envío de 90210?