El ecosistema de los Grandes Modelos del Lenguaje o LLM’s continúa con su crecimiento exponencial. El otro día se comenzó a hablar sobre el posible lanzamiento de GPT 5, ahora, el último en sumarse a este bucle infinito de novedades ha sido Meta. El conglomerado gestionado por Mark Zuckerberg acaba de anunciar el lanzamiento de Meta LLaMA 3, la nueva generación de su modelo de lenguaje a gran escala. 

La nueva versión de este LLM ofrece a los desarrolladores modelos pre-entrenados y ajustados a las instrucciones con parámetros 8B y 70B, gracias a los cuales se pueden desarrollar una gran variedad de casos de uso. Además, han anunciado otra versión más potente que puede alcanzar los 400B. Actualmente, LLaMA 3 está pre-entrenado con más de 15T de tokens recogidos de fuentes públicas. Un salto cualitativo ya que este modelo cuenta con una base de datos siete veces mayor que su precedente LLaMA 2.

Un modelo potente que, no olvidemos, tiene por competencia directa a otros grandes como Gemini o GPT. Diferentes modelos frente a los que, de acuerdo a las pruebas realizadas internamente por la compañía, LLaMA 3 ofrece resultados comparativamente mejores. Concretamente, frente a GPT-3.5, Mistral 7B o Gemini Pro 1.5. Un hito importante que no sabemos cuánto durará, ya que, como indicábamos previamente, este ecosistema está en constante evolución y cambio.

Tal y como han afirmado en la publicación realizada en su blog, con este nuevo lanzamiento Meta se propuso «construir los mejores modelos abiertos que estuvieran a la altura de los mejores modelos propietarios disponibles en la actualidad. Queríamos incorporar las devoluciones y comentarios de los desarrolladores para aumentar la utilidad general de LLaMA 3 y lo estamos haciendo sin dejar de liderar en el uso y despliegue responsables de los LLM«.

Todo ello, tras la realización diferentes pruebas que buscan reducir las casuísticas y respuestas más problemáticas, así como, proteger de los riesgos de uso indebido relacionados con la seguridad química, biológica, cibernética y otras áreas de riesgo.

A futuro esperan que este modelo sea tanto multilingüe como multimodal, además de poder trabajar con un contexto mucho más amplio y seguir mejorando cuestiones relacionadas con el rendimiento como el razonamiento y la codificación. En cualquier caso, el enfoque de código abierto se mantendrá, como bien han indicado. «Estamos comprometidos con el crecimiento y el desarrollo continuos de un ecosistema de IA abierto para liberar nuestros modelos de forma responsable. Llevamos mucho tiempo creyendo que la apertura conduce a productos mejores y más seguros, a una innovación más rápida y, en general, a un mercado global mejor. Esto es bueno para Meta y para la sociedad» comentaban desde el blog.

Sin embargo, no este aumento en capacidades no es la única noticia que debemos considerar. La accesibilidad para la sociedad en su conjunto, y no solo para la comunidad desarrolladora e investigadora, también ha hecho que este anuncio sea aún más interesante. Según el comunicado publicado, LLaMA 3 estará disponible a través de un asistente conversacional en Facebook, Instagram, WhatsApp y Messenger. Por el momento, estará disponible en Australia, Canadá, Ghana, Jamaica, Malawi, Nueva Zelanda, Nigeria, Pakistán, Singapur, Sudáfrica, Uganda, Zambia y Zimbabue. Además, estará disponible a través de Meta.ai, un entorno web en el que podrás interaccionar con el asistente.

Como destacábamos al inicio, este nuevo lanzamiento sigue poniendo de manifiesto la investigación constante que las grandes tecnológicas están haciendo en LLM y en lo que se ha venido a bautizar como IA Generativa. Sin embargo, ¿qué otros lanzamientos nos esperan? ¿cuánto tendremos que esperar para verlo? y ¿quién será el protagonista?

Fuente: Meta News

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *