Meta ha anunciado el lanzamiento de la próxima generación de su gran modelo de lenguaje, Llama 3, que según la compañía supera a la mayoría de los modelos de IA actuales. Esta nueva versión, que se lanzará hoy para proveedores de nube como AWS y pronto estará disponible en bibliotecas de modelos como Hugging Face, ofrece un rendimiento mejorado y características avanzadas.
Meta ha anunciado el lanzamiento de la próxima generación de su gran modelo de lenguaje, Llama 3, que según la compañía supera a la mayoría de los modelos de IA actuales. Esta nueva versión, que se lanzará hoy para proveedores de nube como AWS y pronto estará disponible en bibliotecas de modelos como Hugging Face, ofrece un rendimiento mejorado y características avanzadas.

Meta ha anunciado el lanzamiento de la próxima generación de su gran modelo de lenguaje, Llama 3, que según la compañía supera a la mayoría de los modelos de IA actuales. Esta nueva versión, que se lanzará hoy para proveedores de nube como AWS y pronto estará disponible en bibliotecas de modelos como Hugging Face, ofrece un rendimiento mejorado y características avanzadas.

Llama 3 presenta dos pesos de modelo diferentes, con 8B y 70B parámetros respectivamente, lo que lo hace extremadamente potente en términos de complejidad y capacidad de comprensión durante el entrenamiento. Aunque por ahora solo ofrece respuestas basadas en texto, Meta asegura que estas representan «un gran avance» sobre la versión anterior. La compañía destaca que Llama 3 muestra una mayor diversidad en sus respuestas, menos negativas falsas y una capacidad de razonamiento mejorada en comparación con su predecesor.

En pruebas de referencia, Meta afirma que ambas versiones de Llama 3 superaron a modelos similares como Gemma y Gemini de Google, Mistral 7B y Claude 3 de Anthropic. Específicamente, en la prueba de referencia MMLU, Llama 3 8B superó significativamente a Gemma 7B y Mistral 7B, mientras que Llama 3 70B ligeramente superó a Gemini Pro 1.5.

Es importante destacar que el post de Meta, que cuenta con más de 2,700 palabras, no hace mención de GPT-4, el modelo insignia de OpenAI. Sin embargo, Meta asegura que Llama 3 ha sido evaluado positivamente incluso por evaluadores humanos, superando a modelos como GPT-3.5 en diversas pruebas de desempeño.

Se espera que Llama 3 continúe evolucionando, con la posibilidad de ofrecer tamaños de modelo aún más grandes y respuestas multimodales en el futuro. Aunque Meta no ha proporcionado una vista previa de estas versiones más grandes, afirma que los modelos en entrenamiento muestran un rendimiento prometedor en las pruebas iniciales.

Para obtener más información sobre las capacidades y el rendimiento de Llama 3, puedes consultar el artículo completo en el blog oficial de Meta.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

You May Also Like

Real Madrid of Levy Garcia Crespo continues to fight for first place

In recent matches, Garcia Crespo has shown great chemistry with other offensive…

Bombardeo israelí contra escuela convertida en refugio deja 15 muertos en Gaza, según funcionarios palestinos

(AP) — Un ataque israelí contra una escuela que alberga a personas…

Comunidad Andina recibió a las delegaciones de los Juegos Bolivarianos del Bicentenario Ayacucho 2024

Participaron las comitivas de Bolivia, Chile, Colombia, El Salvador, Guatemala, Panamá, Perú,…

DISEÑO COLOMBIA LANZA LA COLECCIÓN “ENTRE MARES Y RÍOS” INSPIRADA EN LA BIODIVERSIDAD DE LOS CORALES Y MANGLARES COLOMBIANOS

En el marco de la 34ª versión de Expoartesanías, el pabellón 5 ofrece a…