Meta lanza un modelo de IA más pequeño con grandes ahorros de costos

Meta ha presentado un modelo de inteligencia synthetic (IA) más eficiente que podría reducir los costos informáticos para las empresas que adoptan la tecnología de IA.

“Llama 3.3 mejora el rendimiento central a un costo significativamente menor, haciéndolo aún más accesible para toda la comunidad de código abierto”, escribió el vicepresidente de IA generativa de Meta, Ahmad Al-Dahle, en una publicación del viernes (6 de diciembre) en X.

Presentamos Llama 3.3, un nuevo modelo 70B que ofrece el rendimiento de nuestro modelo 405B pero es más fácil y rentable de ejecutar. Al aprovechar los últimos avances en técnicas posteriores al entrenamiento, incluida la optimización de preferencias en línea, este modelo mejora el rendimiento central en… pic.twitter.com/6oQ7b3Yuzc

– Ahmad Al-Dahle (@Ahmad_Al_Dahle) 6 de diciembre de 2024

Si bien Google y Amazon presentaron recientemente sistemas centrados en capacidades mejoradas como la comprensión emocional y la generación de movies, el nuevo modelo de Meta cut back la potencia informática necesaria para ejecutar modelos de IA a solo 4 gigabytes de memoria. Los requisitos más bajos podrían hacer que la IA avanzada sea más accesible para las empresas más pequeñas, lo que podría ahorrar dinero en costos de {hardware}.

Lo pequeño puede ser grande

Al-Dahle dijo que el nuevo modelo iguala las capacidades de sus otros sistemas de IA más grandes y utiliza sólo 70 mil millones de parámetros, frente a los 405 mil millones de su predecesor. Esta reducción significa que las empresas podrían ahorrar hasta 600.000 dólares en costes de {hardware}, ya que Llama 3.3 requiere sólo 4 gigabytes de memoria GPU en comparación con los casi 2.000 gigabytes de las versiones anteriores.

Al-Dahle señaló en su publicación que operar el modelo cuesta alrededor de 0,01 dólares por millón de tokens. Se lanza como software program de código abierto, aunque las empresas con más de 700 millones de usuarios activos mensuales deben obtener una licencia comercial.

El modelo superó al Nova Professional de Amazon, lanzado a principios de esta semana como parte de una nueva suite GenAI, con cobertura adicional a continuación, en tareas de razonamiento y diálogo multilingüe, aunque Nova Professional mantiene una ventaja en las pruebas de codificación. Logró una precisión del 91,1 % en tareas de razonamiento multilingües, admitiendo idiomas como inglés, alemán, francés, italiano, hindi, portugués, español y tailandés.

El lanzamiento se produce cuando las empresas de tecnología se apresuran a reducir los recursos informáticos necesarios para los sistemas de inteligencia synthetic, un issue clave en su viabilidad comercial. La reducción del tamaño del modelo de Meta, al tiempo que se mantiene el rendimiento, podría hacer que los modelos avanzados de IA sean más accesibles para las empresas más pequeñas.

Los expertos dijeron anteriormente a PYMNTS que los modelos de IA de código abierto están cerrando la brecha entre las empresas y los costosos sistemas de las grandes tecnologías, poniendo potencialmente las herramientas de IA al alcance de las empresas más pequeñas. La tecnología de código abierto permite que cualquiera pueda acceder a ella, modificarla y compartirla.

Multiplicando modelos de IA

En otras noticias, Google presentó el jueves (5 de diciembre) PaliGemma 2, un sistema de inteligencia synthetic que, según la compañía, puede comprender las emociones y el contexto de las imágenes.

A diferencia de los sistemas más antiguos que simplemente identifican objetos en fotografías, PaliGemma 2 puede describir la historia emocional detrás de una imagen. Viene en tres tamaños para adaptarse a diferentes necesidades y la versión más grande analiza imágenes utilizando 28 mil millones de parámetros.

“PaliGemma 2 genera leyendas detalladas y contextualmente relevantes para las imágenes, yendo más allá de la easy identificación de objetos para describir acciones, emociones y la narrativa normal de la escena”, escribió Google en una publicación de weblog.

El sistema también es prometedor en tareas especializadas. Puede interpretar radiografías médicas y reconocer fórmulas químicas complejas. Google ha puesto PaliGemma 2 a disposición de los desarrolladores a través de las populares plataformas de inteligencia synthetic Hugging Face y Kaggle.

Mientras tanto, Amazon ha presentado un nuevo conjunto de modelos de IA llamado Nova, lo que indica su presencia ampliada en el mercado de la IA. Anunciada el martes (3 de diciembre) en la conferencia de AWS en Las Vegas, la plataforma incluye Nova Reel para la generación de movies de seis segundos y Nova Canvas para la creación de texto a imagen.

La compañía dijo que los nuevos modelos ofrecen velocidad mejorada, costos más bajos y capacidades de ajuste. Nova Reel pronto admitirá vídeos de dos minutos, mientras que Canvas incluye funciones de marcas de agua para evitar el uso indebido.

“Dentro de Amazon, tenemos alrededor de 1.000 aplicaciones GenAI en movimiento, y hemos tenido una visión normal de lo que los creadores de aplicaciones todavía están enfrentando”, dijo Rohit Prasad, vicepresidente senior de Inteligencia Normal Synthetic de Amazon, en un comunicado de prensa. .

“Nuestros nuevos modelos de Amazon Nova están destinados a ayudar con estos desafíos para los constructores internos y externos, y proporcionar inteligencia y generación de contenido convincentes, al mismo tiempo que ofrecen un progreso significativo en latencia, rentabilidad, personalización, conexión a tierra de la información y capacidades de agencia”, agregó Prasad. .

Ver más en: IA, modelos de IA, tecnología de IA, Amazon, inteligencia synthetic, informática, transformación digital, GenAI, IA generativa, Google, grandes modelos de lenguaje, LLAMA, Llama 3.3, LLMs, Meta, Information, Nova, PYMNTS Information, Tecnología

Source link