¿Estás interesado en ellos? OFERTAS? Ahorra con nuestros cupones en Whatsapp o TELEGRAMA!

Llama 3 desafía a los gigantes: aquí está el nuevo modelo de IA de Meta

Abril 18 2024

Meta ha agregado dos nuevos. modelos lingüísticos a su serie: Llama 3 8B e Llama 3 70B. Estos prometen un rendimiento superior en el mundo de la inteligencia artificial. ¿La noticia más llamativa? La presencia de 8 mil millones y 70 mil millones de parámetros respectivamente. Estos números representan la complejidad y la capacidad del modelo para manejar y intentar información.

Llama 3 no son solo dos modelos: hay más material en camino

Meta no se detiene ahí; planea lanzar más modelos de la serie Llama 3, pero sin especificar fecha. Esta estrategia crea anticipación y también demuestra el compromiso de la empresa de mejorar continuamente sus ofertas.

I nuevos modelos de llamas se describen como un salto con respecto a los modelos anteriores. Esta mejora se debe en parte al uso de dos clústeres de GPU personalizados, cada uno con 24.000 unidades, lo que permitió entrenar los modelos de forma más eficaz y precisa. Meta afirma que, debido a la cantidad de parámetros que poseen, estos modelos son entre los mejores disponibles hoy para la inteligencia artificial generativa.

El rendimiento de Llama 3 se midió a través de varios puntos de referencia de IA, que son pruebas estandarizadas que se utilizan para evaluar las capacidades de los modelos de IA. Éstas incluyen MMLU para el conocimiento, ARC para la adquisición de habilidades, e DROP para razonar sobre bloques de texto. Si bien existen diferentes opiniones sobre la utilidad de estos puntos de referencia, siguen siendo un método común para evaluar y comparar las capacidades de los modelos de IA.

En particular, Llama 3 8B superó a modelos similares de código abierto con menos parámetros, como Mistral y Google Gemma, en al menos nueve puntos de referencia diferentes. Esto incluye pruebas de conocimientos generales, razonamiento y habilidades específicas en áreas como biología, física, química e incluso generación de códigos y problemas matemáticos. Lo cual, por ejemplo, GPT-4 no puede hacer muy bien.

El modelo más grande, Llama 3 70B, no sólo compite sino que en algunos casos supera a modelos emblemáticos como Géminis 1.5 Pro de Google en varias pruebas, demostrando que a pesar de la fuerte competencia, puede hacer frente incluso a los gigantes del sector. Sin embargo, es importante tener en cuenta que, si bien supera a algunos modelos emblemáticos como Soneto de Claude 3 de Anthropic En varias pruebas, no alcanza las prestaciones del modelo más avanzado Claude 3 Opus.