Adam Ross Nelson sobre Ciencia de Datos Confiable

Adam Ross Nelson on Reliable Data Science

A medida que surgen nuevos campos dentro de la ciencia de datos y la investigación aún es difícil de comprender, a veces es mejor hablar con los expertos y pioneros del campo. Recientemente, hablamos con Adam Ross Nelson, entrenador de carreras en ciencia de datos y autor de “Cómo convertirse en un científico de datos” y “Confident Data Science”. En la entrevista, hablamos sobre qué es la ciencia de datos confiable, cómo los científicos de datos pueden usar la inteligencia artificial de manera confiable y ética, y campos emergentes como la ingeniería de instrucciones. Puedes escuchar la entrevista completa de Lightning aquí y leer la transcripción de dos preguntas interesantes con Adam Ross Nelson a continuación.

P: ¿Qué es la Ciencia de Datos Confiable?

Adam Ross Nelson: Sabes, he pensado mucho en eso, no solo por el libro en sí, sino cuando me acercaron el verano pasado para hacer este libro como parte de una serie, pensé “¿Qué es exactamente la ciencia de datos confiable?” Una de las cosas que ayuda a entender el título es que este libro es parte de una serie, puedes encontrar otros libros en la serie. Hay un libro de UX confiable, un libro de codificación confiable y luego mi libro es sobre ciencia de datos confiable.

Reflexioné sobre eso y creo que la ciencia de datos confiable se conecta muy bien con la regla del 80-20. Eso significa que aproximadamente el ochenta por ciento del trabajo se realiza con el veinte por ciento de las herramientas. Entonces, si en la ciencia de datos, donde tenemos muchas tareas comunes, desafíos y casos de uso, y la ciencia de datos presenta una amplia gama de soluciones, todas las cuales, o el ochenta por ciento de las cuales, pueden ser atendidas por el veinte por ciento de las herramientas y el veinte por ciento del conocimiento asociado con la ciencia de datos. Entonces, los científicos de datos tienen que especializarse un poco más allá de ese veinte por ciento, pero ningún científico de datos podría conocer nunca el cien por ciento del tema y creo que eso es cierto para muchos campos.

Para mí, la ciencia de datos confiable es reconocer esta regla del 80-20, reconocer esta dinámica del 80-20. Simplemente saber que la ciencia de datos es un campo muy diverso y que hay espacio para muchos caminos con muchos antecedentes y muchos intereses, y ningún científico de datos podría conocer nunca todo el campo. Es saber lo que sabes y hacerlo bien.

P: ¿Qué problemas surgieron que te llevaron a escribir este libro?

Adam Ross Nelson: Vi un problema en el mundo editorial de la ciencia de datos hace un par de años, cuando fui a mi estantería y saqué aproximadamente 10 libros de ciencia de datos, algunos de ellos eran muy generales y otros muy específicos de una industria. Luego, revisé los apéndices, los índices y los glosarios y busqué ética. ¿Y te creerías que solo dos de los diez libros mencionaban o discutían la ética de manera significativa y sustantiva?

Así que ahí mismo supe que había una oportunidad, y sabía que si alguna vez escribía un libro, trabajaría para corregir eso y reunir un libro que fuera más intencional al centrar la ética, la responsabilidad y la confiabilidad en todo y que impregnara el libro.

Otra cosa que hice para este libro fue reescribir la historia de la ciencia de datos. Muchas personas señalarán a mediados de la década de 1990 como algunos de los orígenes de la ciencia de datos y algunas de las primeras personas que realmente inventaron la ciencia de datos, pero yo señalo a Ada Lovelace y Florence Nightingale en la década de 1800. Si nunca has leído sobre Ada Lovelace, debes saber que ella estaba escribiendo sobre IA generativa en la década de 1800. Escribió sobre cómo estaba trabajando con Charles Babbage en la máquina de computación, que fue una de las primeras computadoras en muchos aspectos. Ada Lovelace a menudo es reconocida como la primera científica de la computación porque se le atribuye ser la primera en escribir un algoritmo informático. En su diario, escribe sobre cómo la máquina analítica podría ser capaz de componer música, y eso es IA generativa.

Cómo aprender más sobre la ciencia de datos confiable y la IA responsable

Aunque muchos científicos de datos pueden tener buenas intenciones al desarrollar algoritmos, a veces es difícil asegurarse de que estén utilizando la IA de manera confiable, ética y responsable. Asistiendo a ODSC West del 30 de octubre al 2 de noviembre, y revisando específicamente la pista de IA Responsable, aprenderás todo lo que necesitas saber sobre la implementación ética de la IA.