Artículos

NanoAgentes:
_
el
_
poder
_
de
_
la
_
IA
_
en
_
tu propio
_
dispositivo

480Academy  ·  I+D  ·  Inteligencia artificial

El equipo de Innovación Aplicada del grupo Cuatroochenta expuso en el T3chFest 2026 cómo los modelos de lenguaje pequeños (SML) pueden automatizar procesos con un mayor control y un menor coste.

Automatizar la carga de facturas, analizar y etiquetar automáticamente artículos e informes o procesar contratos y documentos legales. Son procesos que un agente de inteligencia artificial puede hacer en una organización sin intervención humana pero, además, lo puede hacer sin enviar ningún dato a la nube. Es decir, ejecutándolo en local, en un dispositivo dentro del propio entorno de la empresa. Eso es posible gracias a los small language models (SLM). Son modelos de lenguaje pequeños que en los últimos tres años han evolucionado muchísimo y han abierto la puerta a lo que podemos llamar nanoagentes.

Esto que te estamos contando lo expusimos y demostramos en una ponencia en la última edición del T3chFest, el mayor festival de tecnología de España que congregó el pasado mes marzo a más de 1.800 personas en la Universidad Carlos III de Madrid. En la charla, explicamos cómo las contribuciones de la comunidad open source al desarrollo de IA están permitiendo crear agentes 100% privados, con mayor control y con costes mucho más ajustados. Son los open weights. Democratizan la IA y suponen una ventaja competitiva real.

Los modelos open weights son sistemas de inteligencia artificial cuyos parámetros numéricos internos (pesos) son públicos para poder personalizar, ejecutar y controlar en entornos propios sin necesidad de depender de una API externa.

¿Por qué son importantes los SLM?

Hace un par de años muchos descartábamos los modelos pequeños. Pensábamos que el cerebro más grande, es decir, los LLM, con inmensos centros de datos y miles de millones de parámetros, eran los que ganaban. Y sí, es cierto. Lo hacen, pero a un coste muy alto y, a decir verdad, no siempre son los más útiles. Gracias a las aportaciones de sistemas como Llama (Meta), Qwen (Alibaba) o DeepSeek, hemos visto que con estos modelos más reducidos podemos obtener rendimientos excelentes.

La clave técnica es la cuantización, es decir, reducir el tamaño y la complejidad del modelo. Se han desarrollado modelos que pueden ejecutarse en un móvil de 8 GB, interactuar con sistemas externos o bases de datos con precisión, y superar el rendimiento de modelos diez veces más grandes. Es lo que en la charla llamamos la "navaja suiza" de la IA: versátil, ligera y potente cuando le damos la arquitectura adecuada.

«Los LLM obtienen mejores resultados, pero el coste de inferencia es muy alto. Destilando y quitando capas de entrenamiento a esos modelos podemos tener utilidades interesantes a un menor coste.»

Nicolás Betancourt, Data Scientist en grupo Cuatroochenta

Evolución del open source en SLMs & LLMs (2023-2026)

«La cuantización funciona como la compresión de una imagen: puedes reducir el tamaño del archivo a la cuarta parte y el ojo humano apenas nota la diferencia. Con los modelos de IA ocurre lo mismo, el rendimiento es prácticamente equivalente al original a partir de un umbral.»

Sergi Fuster, Data Scientist en Cuatroochenta

«El secreto no está en el modelo sino en la orquestación y cómo gestionamos los datos.»

Jaume Barrios, Head of AI en Cuatroochenta

En el grupo Cuatroochenta exploramos tecnologías avanzadas y emergentes para detectar oportunidades y convertirlas en soluciones útiles y reales.

Conoce los proyectos de 480LABS: I+D