Un grupo de hackers acaba de conmocionar a la comunidad tecnologica y musical al anunciar que ha recopilado y almacenado alrededor de 300 terabytes de datos de Spotify la plataforma de transmision de musica en linea mas grande del mundo.
Esta base de datos incluye decenas de millones de archivos de audio imagenes portadas de albumes y una enorme cantidad de super datos que se publican actualmente a traves de Anna's Archive una herramienta de busqueda de codigo abierto para bibliotecas subterraneas.
Segun la informacion publicada Anna's Archive actualmente almacena 86 millones de archivos de audio junto con mas de 256 millones de lineas de super datos de canciones con una capacidad total de aproximadamente 300 TB.
Los super datos musicales incluyen nombres de artistas musicos productores generos duracion fecha de lanzamiento y codigo ISRC codigo de identificacion internacional para cada grabacion.
Con 186 millones de codigos ISRC esta plataforma reconoce que posee la mayor base de datos de datos de datos de musica publica del mundo.
El grupo detras de Anna's Archive dijo que su objetivo es construir un 'archivo de conservacion de musica' integral que permita que cualquiera que tenga suficiente capacidad de almacenamiento pueda copiar.
Segun el plan ademas de los super datos que se han publicado 86 millones de archivos de musica que representan alrededor del 99 6% de las escuchas totales en Spotify se anunciaran sucesivamente a traves de torrents ordenados por popularidad.
Este movimiento es particularmente notable en el contexto del rapido desarrollo de la inteligencia artificial. Las empresas de IA dependen fuertemente de datos a gran escala para entrenar modelos desde texto imagenes hasta sonido.
Un tan vasto almacen de datos musicales podria convertirse en una fuente de recursos atractiva para la formacion de modelos de IA para crear musica analisis de sonido o multidimensionales aumentando el estres existente entre la industria de la IA y los propietarios de derechos de autor.
Spotify confirmo que ha detectado e inactivado cuentas relacionadas con la copia ilegal de datos y ha implementado medidas adicionales de proteccion.
Segun la empresa la investigacion preliminar muestra que un tercero ha recopilado datos super publicos y ha utilizado medidas ilegales para superar el sistema de gestion de derechos de autor digitales (DRM) accediendo asi a una parte de los archivos de audio.
Anna's Archive funciona como una herramienta de busqueda que ayuda a los usuarios a acceder al contenido almacenado en otras fuentes de Internet y afirma que la plataforma no almacena directamente contenido que infringe los derechos de autor.
Anteriormente la base de datos de la plataforma eran principalmente libros articulos de investigacion y documentos academicos. La expansion a los super datos y la musica marca un nuevo paso al tiempo que hace que Anna's Archive se convierta en un objetivo frecuente en las solicitudes de retirada de contenido de los propietarios de derechos de autor.
El equipo de operacion de Anna's Archive cree que las bibliotecas de musica actuales se centran demasiado en artistas famosos y archivos de alta calidad lo que dificulta el almacenamiento de toda la historia de la musica humana.
Al priorizar la integridad y utilizar el indice de popularidad de Spotify declaran que quieren crear una lista de musica representativa de todas las grabaciones que se hayan lanzado.
Aunque se justifica bajo el titulo de'seguridad cultural' este almacen de datos de 300 TB todavia plantea una gran pregunta sobre la frontera entre el almacenamiento la infraccion de derechos de autor y la explotacion de datos en la era de la IA donde el valor de los datos se vuelve cada vez mas sensible y controvertido.