Washington, 17 de julio (Portaltic/EP) – Corporaciones tecnológicas como Apple, Nvidia y Anthropic han utilizado una base de datos EleutherAI, que transcribe más de 173. 500 vídeos de YouTube, para ejercer su inteligencia sintética (IA), en contravención de las regulaciones de la Plataforma de Google y sin el permiso de los autores.
El director ejecutivo de YouTube, Neal Mohan, dijo en abril que los vídeos de la plataforma para ejercitar modelos y equipos de IA constituían una violación de sus políticas. Se refería al supuesto uso que OpenAI pudo haber hecho de Sora, una IA que crea escenas de vídeo realistas a partir de instrucciones textuales. .
Mohan continuó diciendo que esto es un uso indebido, ya que los creadores de contenido que deciden publicar videos en YouTube esperan que sus pinturas estén protegidas mediante los términos de servicio.
A pesar de las políticas de la plataforma, esto resulta ser una práctica generalizada, como muestra ahora un nuevo estudio de Proof News. En este caso, las principales empresas de tecnología, además de Apple, Nvidia, Salesforce y Anthropic, entrenaron sus IA con transcripciones de miles de Videos de Youtube.
Habrían accedido directamente, pero a través de la base de datos proporcionada a través de la empresa EleutherAI, en la que el citado medio descubrió transcripciones de 173. 536 vídeos de YouTube, de más de 48. 000 canales, a través de autores como el MIT, Harvard, el Wall Street Journal, la BBC. , MrBeast y PewDiePie, entre otros.
Aunque la base de conocimiento incluye imágenes, pero solo los textos de los videos, es decir, subtítulos y traducciones a otros idiomas, el conocimiento habría sido recopilado y utilizado para la educación de la IA sin la autorización de sus autores, como informó a través de Proof. Noticias.
Salesforce y Anthropic han mostrado a los medios antes mencionados el uso de la base de datos EleutherAI, que forma parte de una compilación más grande llamada “Stack” y que también incluye información del Parlamento Europeo, Wikipedia en inglés y correos electrónicos de trabajadores de Enron hechos públicos. en una investigación federal en los Estados Unidos. Gran parte de esta pila está disponible públicamente y también se puede utilizar a través de académicos e investigadores.