Google AI escucha 15 años de grabaciones de fondo marino para canciones de ballenas ocultas

Google AI escucha 15 años de grabaciones de fondo marino para canciones de ballenas ocultas

Google y un grupo de cetólogos del juego han emprendido una investigación basada en la IA de años de grabaciones submarinas, con la esperanza de crear un modelo de aprendizaje automático que pueda detectar las llamadas de ballenas jorobadas. Es parte del nuevo programa “AI para el bien social” de la compañía que está, obviamente, posicionado para contrarrestar la narrativa de que la IA se utiliza principalmente para el reconocimiento facial y la orientación de anuncios.

Las ballenas viajan bastante mientras buscan mejores lugares para alimentarse, aguas más cálidas y reuniones sociales. Pero, naturalmente, estos movimientos pueden ser bastante difíciles de rastrear. Afortunadamente, las ballenas se llaman unas a otras y cantan de manera individualmente identificable, y estas canciones pueden viajar grandes distancias bajo el agua.

Por lo tanto, con una red mundial de dispositivos de escucha colocados en el fondo del océano, puede rastrear los movimientos de las ballenas, si quiere escuchar años de ruido de fondo y seleccionar las llamadas manualmente, es decir. Y así es como lo hemos hecho durante bastante tiempo, aunque las computadoras han ayudado a aligerar la carga. El equipo de Google, en colaboración con NOAA, decidió que era una buena combinación para los talentos de los sistemas de aprendizaje automático.

Estos modelos de inteligencia artificial (empleamos el término aquí libremente) son excelentes para rastrear toneladas de datos ruidosos para patrones particulares, por lo que se aplican a datos voluminosos como los de los radiotelescopios y las cámaras de CCTV.

En este caso, los datos fueron años de grabaciones de una docena de hidrófonos estacionados en todo el Pacífico. Este conjunto de datos ya se ha investigado en gran medida, pero los investigadores de Google querían ver si un agente de inteligencia artificial podía hacer el trabajo minucioso y lento de hacer un primer pase y marcar períodos de sonido interesante con un nombre de especie, en este caso jorobadas. , pero podría ser fácilmente una ballena diferente o algo completamente diferente.

 

Espectrogramas de la canción de la ballena, izquierda, un ruido desconocido de “banda estrecha”, centro, y la propia unidad de disco duro de la grabadora, derecha.

Curiosamente, pero no sorprendentemente en retrospectiva, el audio no se analizó como tal, sino que el audio se convirtió en imágenes que podrían Mira para patrones en. Estos espectrogramas son un registro de la fuerza del sonido en un rango de frecuencias a lo largo del tiempo, y se pueden usar para todo tipo de cosas interesantes. Sucede que también están bien estudiados por investigadores de aprendizaje automático y de visión artificial, que han desarrollado diversos medios para analizarlos de manera eficiente.

El modelo de aprendizaje automático se proporcionó con ejemplos de llamadas de ballenas jorobadas y aprendió a identificarlas con una precisión razonable en un conjunto de datos de muestra. Se realizaron varios experimentos para averiguar qué configuraciones eran óptimas, por ejemplo, qué longitud de clip era fácil de procesar y no demasiado larga, o qué frecuencias podían ignorarse con seguridad.

El esfuerzo final dividió los años de datos en clips de 75 segundos, y el modelo pudo determinar, con un 90 por ciento de precisión, si un clip contenía una “unidad jorobada” o un sonido de ballena relevante. Eso no es un pequeño error, por supuesto, pero si confía un poco en la máquina, puede ahorrar bastante tiempo, o el tiempo de su asistente de laboratorio, de todos modos.

Un segundo esfuerzo se basó en lo que se denomina aprendizaje no supervisado, en el que el sistema establece sus propias reglas sobre lo que constituye la similitud entre los sonidos de ballena y los sonidos no ballena, creando una trama que los investigadores podrían clasificar y encontrar grupos relevantes.

 

Visualización de cómo el modelo no supervisado clasifica varios sonidos. Los azules representan las llamadas jorobadas.

Hace visualizaciones más interesantes, pero es más difícil de explicar, y al menos no parece haber resultado en un conjunto de clasificaciones tan útil como el método más tradicional.

Al igual que con aplicaciones similares de aprendizaje automático en diversos campos académicos, esto no reemplazará la observación y la documentación cuidadosas, sino que las aumentará. Tomar parte del trabajo duro de la ciencia permite a los investigadores centrarse en sus especialidades en lugar de atascarse en estadísticas repetitivas y sesiones de análisis de datos de una hora de duración.

 

Source link