Conoce FathomNet una base de datos de imágenes de código abierto que utiliza algoritmos de inteligencia artificial y aprendizaje automático para ayudar a procesar el retraso de datos visuales para comprender nuestro océano y sus habitantes.

FathomNet es una base de datos de imágenes de código abierto que utiliza IA y aprendizaje automático para comprender el océano y sus habitantes.

El océano está cambiando a un ritmo sin precedentes, lo que dificulta mantener una administración responsable mientras se monitorean visualmente grandes cantidades de datos marinos. La cantidad y velocidad de la recolección de datos necesaria están superando nuestra capacidad para procesarlos y analizarlos rápidamente, ya que la comunidad de investigación busca puntos de referencia. La falta de consistencia en los datos, el formato inadecuado y el deseo de conjuntos de datos etiquetados significativos han contribuido al éxito limitado de los avances recientes en el aprendizaje automático, que han permitido un análisis rápido y más complejo de datos visuales.

Para cumplir con este requisito, varias instituciones de investigación trabajaron con MBARI para acelerar la investigación oceánica utilizando las capacidades de la inteligencia artificial y el aprendizaje automático. Uno de los resultados de esta colaboración es FathomNet, una base de datos de imágenes de código abierto que utiliza algoritmos de procesamiento de datos de vanguardia para estandarizar y agregar datos etiquetados cuidadosamente seleccionados. El equipo cree que el uso de la inteligencia artificial y el aprendizaje automático será la única forma de acelerar los estudios críticos sobre la salud del océano y eliminar el cuello de botella para el procesamiento de imágenes submarinas. Los detalles sobre el proceso de desarrollo de esta nueva base de datos de imágenes se pueden encontrar en una publicación de investigación reciente en la revista Scientific Reports.

El aprendizaje automático ha transformado históricamente el campo del análisis visual automatizado, en parte gracias a los vastos volúmenes de datos anotados. En lo que respecta a las aplicaciones terrestres, los conjuntos de datos de referencia a los que acuden los investigadores de aprendizaje automático y visión por computadora son ImageNet y Microsoft COCO. Para proporcionar a los investigadores un estándar rico y atractivo para el análisis visual submarino, el equipo creó FathomNet. Con el fin de establecer un recurso de entrenamiento de imágenes submarinas de acceso gratuito y altamente mantenido, FathomNet combina imágenes y grabaciones de muchas fuentes diferentes.

Los trabajadores de investigación del Laboratorio de Video de MBARI anotaron cuidadosamente datos que representan casi 28,000 horas de video de aguas profundas y más de 1 millón de fotos de aguas profundas que MBARI recopiló durante 35 años. En la biblioteca de video de MBARI se encuentran más de 8.2 millones de anotaciones que documentan observaciones de animales, ecosistemas y objetos. Este conjunto de datos integral sirve como una herramienta invaluable para los investigadores del instituto y sus colaboraciones internacionales. El Laboratorio de Tecnología de Exploración de la National Geographic Society recopiló más de 1,000 horas de datos de video en diversos hábitats marinos y lugares en todas las cuencas oceánicas. Estas grabaciones también se han utilizado en la plataforma de análisis colaborativo basada en la nube desarrollada por CVision AI y anotada por expertos de la Universidad de Hawái y OceansTurn.

Además, en 2010, el equipo de Exploración Oceánica de la Administración Nacional Oceánica y Atmosférica (NOAA) a bordo del barco NOAA Okeanos Explorer recopiló datos de video utilizando un sistema de vehículo operado a distancia dual. Para anotar los videos recopilados de manera más extensa, comenzaron a financiar taxonomistas profesionales en 2015. Inicialmente, obtuvieron anotaciones a través de la colaboración de científicos voluntarios participantes. Una parte del conjunto de datos de MBARI, así como materiales de National Geographic y NOAA, se incluyen en FathomNet.

Dado que FathomNet es de código abierto, otras instituciones pueden contribuir fácilmente a él y utilizarlo en lugar de métodos convencionales que requieren más tiempo y recursos para el procesamiento y análisis de datos visuales. Además, MBARI inició una iniciativa piloto para utilizar modelos de aprendizaje automático entrenados con datos de FathomNet para analizar videos tomados por vehículos submarinos controlados de forma remota (ROVs). El uso de algoritmos de inteligencia artificial aumentó la tasa de etiquetado diez veces y redujo el esfuerzo humano en un 81 por ciento. Los algoritmos de aprendizaje automático basados en datos de FathomNet pueden revolucionar la exploración y el monitoreo del océano. Un ejemplo de ello es el uso de vehículos robóticos equipados con cámaras y algoritmos de aprendizaje automático mejorados para la búsqueda y monitoreo automáticos de vida marina y otras cosas submarinas.

Con las contribuciones en curso, FathomNet actualmente tiene 84,454 imágenes que representan 175,875 localizaciones de 81 colecciones diferentes para 2,243 conceptos. El conjunto de datos pronto tendrá más de 200 millones de observaciones después de obtener 1,000 observaciones independientes para más de 200,000 especies animales en diversas posiciones y configuraciones de imágenes. Hace cuatro años, la falta de fotos anotadas impedía que el aprendizaje automático examinara miles de horas de películas oceánicas. Al desbloquear descubrimientos y habilitar herramientas que los exploradores, científicos y el público en general pueden utilizar para acelerar el ritmo de la investigación oceánica, FathomNet convierte esta visión en realidad.

FathomNet es una excelente ilustración de cómo la colaboración y la ciencia comunitaria pueden promover innovaciones en nuestra comprensión del océano. El equipo cree que el conjunto de datos puede ayudar a acelerar la investigación oceánica cuando comprender el océano es más crucial que nunca, utilizando los datos de MBARI y los demás colaboradores como base. Los investigadores también enfatizan su deseo de que FathomNet funcione como una comunidad donde los aficionados al océano y los exploradores de todas las áreas de la vida puedan compartir sus conocimientos y habilidades. Esto servirá como un trampolín para abordar problemas con los datos visuales del océano que de otra manera no se habrían logrado sin una participación generalizada. Con el fin de acelerar el procesamiento de datos visuales y crear un océano sostenible y saludable, FathomNet se está mejorando constantemente para incluir más datos etiquetados de la comunidad.

Este artículo está escrito como un resumen de investigación por el personal de Marktechpost basado en el artículo de investigación ‘FathomNet: una base de datos global de imágenes para habilitar la inteligencia artificial en el océano’. Todo el crédito de esta investigación va a los investigadores de este proyecto. Echa un vistazo al artículo, herramienta y artículo de referencia. Además, no olvides unirte a nuestro SubReddit de ML de más de 26k, canal de Discord y boletín de correo electrónico, donde compartimos las últimas noticias de investigación en IA, proyectos interesantes de IA y más.

La publicación Conoce FathomNet: una base de datos de imágenes de código abierto que utiliza algoritmos de inteligencia artificial y aprendizaje automático para ayudar a procesar el desfase de datos visuales para comprender nuestro océano y sus habitantes apareció primero en MarkTechPost.