Anuncian encuentro de María Corina Machado con la diáspora venezolana en Madrid
Copa Airlines reanudó vuelos desde Panamá hacia Valencia
Rehenes de la revolución: ¿por qué el chavismo dejó a los militares por fuera de la amnistía?
Rapero 6ix9ine reveló nuevos detalles de su convivencia con Maduro en la misma celda en Nueva York: “olía a mier** cuando llegó”
Régimen de Cuba comienza liberación de presos tras anuncio de indulto por “Semana Santa”
“Delcy Rodríguez es una dictadora” y “no va a haber paz en Venezuela hasta que se reinicie un proceso en vía de la democracia”: Ronald Rodríguez
Trump recuerda en su discurso su «empresa conjunta» petrolera con Venezuela
Portugal dice estar dispuesto a mantener un trabajo diplomático con Venezuela
María Corina Machado pide seguir avanzando en el «renacer» en libertad de Venezuela
La arquitectura legal de la minería en Venezuela se reconfigura ante el interés de EE.UU.
Portugal espera libertad de presos políticos lusos tras reunión con canciller de Venezuela
Rick Scott sobre Venezuela: “Ninguna tiranía dura para siempre”
España lideró las solicitudes de asilo de la UE en 2025: venezolanos encabezaron la lista
Trump relaja las sanciones para facilitar la reapertura de la embajada de Venezuela en Estados Unidos
Marco Rubio dice que desconocía del contrato de un amigo para acercar a EE.UU. y al Gobierno de Maduro
Discuten en España el apoyo gubernamental a la dictadura de Delcy Rodríguez
En 48 horas comienza comparecencia de Nicolás Maduro en Nueva York
Cada vez más cubanos eligen establecerse en Latinoamérica: el rol de Venezuela
Pablo Iglesias disfrutó privilegios en Cuba mientras la población enfrenta una crisis aguda
Colombia dice que fue un “hecho accidental” hallazgo de bomba ecuatoriana en su frontera

OpenAI lanza nuevos modelos para la transcripción y la conversión a voz

OpenAI lanza nuevos modelos para la transcripción y la conversión a voz

Breaking

21 de marzo de 2025

By Redacción - 1 año ago

0 35 1 minute read

OpenAI ha anunció nuevos modelos de audio y voz con los que busca impulsar las capacidades de agente de los ‘chatbots’, con el objetivo en el futuro de que los desarrolladores puedan “incorporar sus propias voces personalizadas”.

La firma tecnológica ha presentado dos nuevos modelos de voz a texto que facilitan al transcripción, basado en GPT-4o y GPT-4o mini, que mejoran la tasa de error y el reconocimiento del lenguaje.

OpenAI los compara con los modelos originales de Whisper, de conversión de voz a texto. En concreto, explica que gpt-4o-transcribe mejora el rendimiento en la tasa de error de palabras debido a las novedades aplicadas al aprendizaje por refuerzo y al entrenamiento intermedio con conjuntos de datos de audios diversos de alta calidad.

Potr otra parte, OpenAI ha anunciado un modelo que realiza la acción inversa: convertir texto a voz. En este caso, el modelo gpt-4o-mini-tts habilita experiencias más personalizadas, ya que “los desarrolladores pueden indicarle al modelo no solo qué decir, sino también cómo decirlo”, como recoge en el blog oficial.

De cara al futuro, OpenAI planea mejorar “la inteligencia y la precisión” de los modelos de audio para que los desarrolladores puedan “incorporar sus propias voces personalizadas”. S

EuropaPress

Tags:

administrator

Related Articles