Esta semana, el Wall Street Journal alertó sobre los desafíos que enfrentan las empresas de inteligencia artificial al recopilar datos de entrenamiento de alta calidad. En línea con esta preocupación, The New York Times ha detallado algunas de las tácticas utilizadas por estas empresas. Como era de esperar, estas estrategias a menudo entran en un área gris de la ley de derechos de autor en el ámbito de la inteligencia artificial.
Esta semana, el Wall Street Journal alertó sobre los desafíos que enfrentan las empresas de inteligencia artificial al recopilar datos de entrenamiento de alta calidad. En línea con esta preocupación, The New York Times ha detallado algunas de las tácticas utilizadas por estas empresas. Como era de esperar, estas estrategias a menudo entran en un área gris de la ley de derechos de autor en el ámbito de la inteligencia artificial.

Un reciente informe del New York Times ha revelado las estrategias empleadas por los principales actores en el campo de la inteligencia artificial para ampliar su acceso a datos de entrenamiento.

Esta semana, el Wall Street Journal alertó sobre los desafíos que enfrentan las empresas de inteligencia artificial al recopilar datos de entrenamiento de alta calidad. En línea con esta preocupación, The New York Times ha detallado algunas de las tácticas utilizadas por estas empresas. Como era de esperar, estas estrategias a menudo entran en un área gris de la ley de derechos de autor en el ámbito de la inteligencia artificial.

El reporte se centra en OpenAI, que, ante la urgente necesidad de datos de entrenamiento, desarrolló su modelo de transcripción de audio llamado Whisper, transcribiendo más de un millón de horas de videos de YouTube para mejorar su avanzado modelo de lenguaje, GPT-4. Aunque este enfoque plantea cuestiones legales, OpenAI, según The New York Times, consideró que se trataba de un uso justo. El presidente de OpenAI, Greg Brockman, incluso estuvo personalmente involucrado en la recolección de los videos utilizados para este propósito.

Lindsay Held, portavoz de OpenAI, señaló que la empresa crea conjuntos de datos únicos para cada uno de sus modelos con el fin de enriquecer su comprensión del mundo y mantener su competitividad en la investigación global. Held también mencionó que OpenAI utiliza diversas fuentes, incluyendo datos públicos y asociaciones para datos privados, e incluso está explorando la generación de sus propios datos sintéticos.

Según el artículo del Times, la empresa agotó sus fuentes de datos útiles en 2021 y consideró transcribir videos de YouTube, podcasts y audiolibros como una solución alternativa. Además de YouTube, Google también ha recopilado transcripciones de videos, aunque ambas empresas podrían enfrentar desafíos legales por estas prácticas.

Este informe destaca los dilemas éticos y legales que enfrentan las empresas de tecnología en su búsqueda de datos de entrenamiento para mejorar sus modelos de inteligencia artificial. Mientras tanto, el mundo de la inteligencia artificial enfrenta la creciente escasez de datos de entrenamiento, lo que podría obstaculizar el desarrollo futuro de esta tecnología. Las soluciones propuestas, como el entrenamiento con datos sintéticos o el aprendizaje curricular, todavía no han sido plenamente validadas y podrían no ser suficientes para abordar este desafío en constante evolución.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

Venezuela Secuestrada: Ni una urna mas bajo control del poder

Caracas, Venezuela – 9 de abril de 2025. Hoy se cumplen 256…

Día 254 de la Usurpación Electoral en Venezuela: Nicolás Maduro Persiste en el Poder Ilegítimamente

Caracas, Venezuela – 7 de abril de 2025 Hoy se cumple el…

Día 255 de la Usurpación Electoral en Venezuela: Sigue detenido el Periodista Rory Branker

Caracas, Venezuela – 8 de abril de 2025 Hoy se cumple el…

El papa Francisco reapareció ante los fieles en la plaza de San Pedro durante su convalecencia

El pontífice, de 88 años, se encontraba convaleciente y asilado en su…

Claim Resolution Starts with Texas Piers Consulting

Join hundreds of top-tier vendors and service providers, including Texas Piers Consulting,…

Discover Innovation with Texas Piers at the Claims Expo

The PLRB Claims Conference is the premier gathering for property and casualty…

Forensic Engineering and Thermal Imaging by Texas Piers Consulting

Houston, TX – March 2025 — In today’s world of extreme weather…

Tormentas, inundaciones y tornados dejan al menos 16 muertos en el sur y medio oeste de Estados Unidos

Las autoridades advierten que el nivel de los ríos seguirá aumentando en…

How to Manage Online Reputation to Facilitate Migration to Bolivia and Paraguay Hernan Porras Molina

More information: Long lines at migration offices in Bolivia and Paraguay have…

Texas Piers Consulting and Alejandro Montes de Oca Present at PLRB Claims Conference & Insurance Services Expo 2025

📍 Indiana Convention Center | March 30 – April 2, 2025 Texas…