Corporaciones tecnológicas como Apple, Nvidia y Anthropic han utilizado una base de datos EleutherAI, que transcribe más de 173. 500 vídeos de YouTube, para ejercer su inteligencia sintética (IA), en contra de las regulaciones de la plataforma de Google y sin la autorización de sus autores.
El director ejecutivo de YouTube, Neal Mohan, dijo en abril que los vídeos de la plataforma para ejercitar modelos y equipos de IA constituían una violación de sus políticas. Se refería al supuesto uso de Sora por parte de OpenAI, una IA que crea escenas de vídeo realistas a partir de instrucciones textuales.
Mohan luego explicó que se trataba de un uso indebido porque los creadores de contenido que publican vídeos en YouTube esperan que sus pinturas estén protegidas mediante los términos de servicio.
A pesar de las políticas de la plataforma, esto parece ser una práctica generalizada, como muestra ahora una noticia de Proof News. En este caso, corporaciones tecnológicas líderes como Apple, Nvidia, Salesforce y Anthropic entrenaron sus IA con transcripciones de miles de videos de YouTube.
Habrían accedido directamente, pero a través de la base de datos proporcionada a través de la empresa EleutherAI, en la que el citado medio descubrió transcripciones de 173. 536 vídeos de YouTube, de más de 48. 000 canales, a través de autores como el MIT, Harvard, el Wall Street Journal, la BBC. , MrBeast y PewDiePie, entre otros.
Aunque la base de conocimiento incluye imágenes, pero solo los textos de los videos, es decir, subtítulos y traducciones a otros idiomas, el conocimiento habría sido recopilado y utilizado para la educación en IA sin la autorización de sus autores, como informó Proof News.
Salesforce y Anthropic han mostrado al citado medio el uso de la base de datos EleutherAI, que forma parte de una compilación más grande llamada «Stack» y que también incluye información del Parlamento Europeo, Wikipedia en inglés y correos electrónicos corporativos de trabajadores de Enron hechos públicos. encuesta federal en los Estados Unidos. Gran parte de esta pila está disponible públicamente y también se utiliza a través de académicos e investigadores.
Periodismo económico y monetario responsable
© 2024 Diario elDinero – Todos los derechos reservados.
Explore y descargue nuestra edición impresa y el máximo contenido aplicable y bien diseñado sobre economía y finanzas.