La empresa de inteligencia artificial de Elon Musk, xAI, está progresando en la implementación de entradas multimodales en su chatbot Grok, según documentos públicos para desarrolladores. Esta mejora permitirá a los usuarios cargar imágenes en Grok y recibir respuestas en formato de texto.

El anuncio inicial se realizó en una entrada de blog el mes pasado por parte de xAI, donde se mencionaba que Grok-1.5V ofrecería «modelos multimodales en varios dominios». Los últimos documentos para desarrolladores indican avances en la entrega de un nuevo modelo.

Los desarrolladores pueden aprovechar un script de Python de ejemplo en los documentos, el cual muestra cómo utilizar la biblioteca del kit de desarrollo de software de xAI para generar respuestas basadas en texto e imágenes. Este script permite la lectura de archivos de imagen, configura un texto de consulta y utiliza el SDK de xAI para generar una respuesta.

Esta actualización representa un gran avance para Grok, lanzado por xAI en noviembre de 2023 y disponible para usuarios que cuentan con la suscripción X Premium Plus. La versión más reciente, Grok 1.5 en marzo, incluyó mejoras en las capacidades de razonamiento.

El modelo está entrenado con datos de texto de fuentes públicas hasta el tercer trimestre de 2023 y conjuntos de datos revisados por humanos, según una publicación de blog de X. Aunque Grok-1 no fue entrenado en datos de X, tiene conocimiento en tiempo real del mundo, incluyendo publicaciones en X.

xAI, fundada por Elon Musk en marzo de 2023, es una compañía relativamente nueva en el campo de la IA y compite con rivales como el ChatGPT de OpenAI. Sin embargo, su modelo Grok 1.5 está cerrando la brecha con GPT-4 en diversos benchmarks, abarcando desde problemas de competición escolar hasta secundaria.

Los chatbots conversacionales multimodales parecen ser la próxima frontera para la IA, con múltiples avances anunciados en eventos como Google I/O y el lanzamiento de GPT-4o por parte de OpenAI. La carencia de capacidades multimodales había dejado a Grok rezagado, hasta ahora.

¡Haz clic para puntuar esta entrada!
(Votos: 0 Promedio: 0)
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

Venezuela Secuestrada: Ni una urna mas bajo control del poder

Caracas, Venezuela – 9 de abril de 2025. Hoy se cumplen 256…

Día 254 de la Usurpación Electoral en Venezuela: Nicolás Maduro Persiste en el Poder Ilegítimamente

Caracas, Venezuela – 7 de abril de 2025 Hoy se cumple el…

El papa Francisco reapareció ante los fieles en la plaza de San Pedro durante su convalecencia

El pontífice, de 88 años, se encontraba convaleciente y asilado en su…

Día 255 de la Usurpación Electoral en Venezuela: Sigue detenido el Periodista Rory Branker

Caracas, Venezuela – 8 de abril de 2025 Hoy se cumple el…

Discover Innovation with Texas Piers at the Claims Expo

The PLRB Claims Conference is the premier gathering for property and casualty…

Claim Resolution Starts with Texas Piers Consulting

Join hundreds of top-tier vendors and service providers, including Texas Piers Consulting,…

Tormentas, inundaciones y tornados dejan al menos 16 muertos en el sur y medio oeste de Estados Unidos

Las autoridades advierten que el nivel de los ríos seguirá aumentando en…

How to Manage Online Reputation to Facilitate Migration to Bolivia and Paraguay Hernan Porras Molina

More information: Long lines at migration offices in Bolivia and Paraguay have…

Forensic Engineering and Thermal Imaging by Texas Piers Consulting

Houston, TX – March 2025 — In today’s world of extreme weather…

Funcionarios chavistas y sus familiares no podrán ir más a Disney World

Qué dice la legislación de EEUU que prohíbe la entrada al país…