Inspección de las predicciones de la Ciencia de Datos Análisis individual + de casos negativos

Inspección predicciones Ciencia de Datos Análisis individual casos negativos

Cómo inspeccionar predicciones específicas y realizar análisis de casos negativos

Alrededor del 40 al 43% de las veces cuando enseño a nuevos aprendices cómo usar los métodos .predict(), recibo la siguiente pregunta:

¿Dónde están las predicciones?

Ojalá esta fuera una pregunta que los aprendices hicieran con más frecuencia. Es una pregunta perspicaz, especialmente para aquellos que son nuevos en Python, la ciencia de datos y que pueden estar viendo el método .predict() por primera vez.

Seguramente el número de grupos que hacen esta pregunta es inferior a la mitad, pero posiblemente la proporción sea menor al 30 o 20%. No llevo un registro preciso.

En la primera parte de esta inmersión profunda, este artículo mostrará primero cómo construir un modelo predictivo sencillo, segundo cómo generar predicciones y tercero cómo inspeccionar las predicciones más detenidamente.

Para la segunda parte de esta inmersión profunda, este artículo también mostrará por qué es útil saber cómo inspeccionar predicciones individuales y también por qué es necesario inspeccionar predicciones individuales. Tener la capacidad de inspeccionar predicciones individuales abre una serie de oportunidades analíticas, por ejemplo, no menos importante el análisis de casos negativos.

Parte Uno: Métodos de Predicción

Si aún no estás familiarizado/a con la construcción de modelos predictivos, te sugiero que consideres leer uno o más artículos que cubran este tema. El Capítulo 11 de “Confident Data Science: Discovering The Essential Skills of Data Science” (por, Yo) muestra cómo construir modelos predictivos.

Por ejemplo, en “Fake Birds & Machine Learning: Using the popular bird variety data to demonstrate nearest neighbors classification” compartí código que entrenó un modelo de aprendizaje automático que puede predecir la variedad de especies de aves basado en el peso, la longitud, la ubicación y el color de un ave. Este ejemplo de aves falsas demostró la modelización predictiva con los datos de especies de aves falsas.

Un Modelo Predictivo Sencillo

Para ayudarnos a concentrarnos en la inspección de predicciones individuales específicas, esta subsección acelerará la creación de un modelo predictivo. Para ser rápidos, esta subsección omitirá la optimización de hiperparámetros y también omitirá algunos pasos de preparación de datos.

También, para agilizar las cosas, analizaremos la evaluación a través de métodos alternativos aparte…