Seis creencias que hacen que tu trabajo en Ciencia de Datos esté plagado de sesgos

6 sesgos en tu trabajo de Ciencia de Datos

No puedes eliminar el sesgo en tu trabajo, pero puedes gestionarlo; aquí te decimos cómo

Si alguna vez has pensado:

  • Mi experiencia es un punto de referencia razonable.
  • Soy una buena persona. Quiero decir, bueno.
  • Mi grupo de personas es bueno. Ellos quieren hacer el bien. -O-
  • Soy un buen juez del mundo. Mis evaluaciones son generalmente correctas.

Estás en compañía de otros, tal vez eso sea algo bueno y tal vez no. Este artículo habla un poco sobre el por qué.

La diseminación en la ciencia se trata de contar una historia. Comencemos este artículo con una historia.

Imagina que eres un arqueólogo excavando un sitio. Estás tamizando a través de capas de historia. Quizás menos difícil de imaginar para esta publicación, imagínate como un científico de datos, menos “terrenal”, pero igualmente absorto en descubrir ideas críticas de los vastos y complejos conjuntos de datos.

La forma en que un arqueólogo interpreta cada artefacto puede revelar sutilezas de sesgo. Lo mismo ocurre con cada idea producida por los científicos de datos. A pesar de nuestras mejores intenciones, nuestras perspectivas están teñidas con nuestras experiencias y creencias, arrojando una sombra de sesgo sobre nuestro trabajo.

A veces el sesgo es bueno. A menudo no lo es.

Los sesgos a favor de comportarse de manera veraz, honesta, ética y de evitar causar daño a los demás son buenos para nosotros y para aquellos que confían en nuestro trabajo. Una de mis molestias es cuando alguien dice:

Necesitamos eliminar el sesgo en nuestro trabajo.

¡Totalmente equivocado! No necesitamos eliminar el sesgo. Necesitamos abrazar los sesgos que nos han inculcado nuestros mejores ángeles. Una mejor manera de expresarlo es que necesitamos eliminar el sesgo perjudicial. O, necesitamos gestionar el sesgo.

Crédito de la imagen: Ilustración del autor creada en Canva con imágenes de stock en Canva.

En el intrincado paisaje de la ciencia de datos, el concepto de sesgo no es novedoso. Siempre nos recordamos de su presencia e impacto. Para bien o para mal, el sesgo se cuela en nuestros datos, algoritmos y, lo que es más importante, en nuestras creencias, manipulando sutilmente las narrativas que creamos a partir de la información cruda y no procesada.