Del comando a la acción: qué supone el salto de asistentes a agentes de IA
Ciudad de México, 08 de enero de 2026.- Los asistentes de IA se han convertido en una herramienta cotidiana para cualquier persona que tenga un ‘smartphone’ o un altavoz inteligente y quiera pedirle a Siri que ponga un temporizador mientras cocina, a Alexa que amenice con algo de música o a Gemini que aclare una duda en cuestión de segundos. Esta forma de interacción, basada en órdenes simples y respuestas inmediatas, está evolucionando hacia un modelo más sofisticado: el de los agentes de IA.
A diferencia de los asistentes, los agentes no solo ofrecen información o sugieren opciones: actúan por su cuenta para alcanzar un objetivo determinado. Planifican, toman decisiones y ejecutan tareas de forma autónoma. «Un asistente ayuda a una persona a tomar decisiones y responde con información, pero no actúa. En cambio, un agente automatiza un proceso, simple o complejo, toma decisiones y actúa para lograrlo. A grandes rasgos, se podría decir que los agentes son más proactivos y resolutivos que los asistentes«, explica Elena Alfaro, responsable global de Adopción de IA de BBVA.
Esta diferencia supone un cambio profundo en el diseño, funcionamiento y propósito de los sistemas de IA. Mientras los asistentes están pensados para servir de interfaz entre el usuario y la información, los agentes están concebidos para resolver problemas sin intervención humana directa.
Según un artículo de IBM, esta capacidad permite que los agentes se empleen para resolver tareas complejas en distintos ámbitos empresariales, como la automatización de sistemas informáticos o la gestión en tiempo real de inventarios. Para lograrlo, utilizan técnicas avanzadas de procesamiento basadas en grandes modelos de lenguaje (LLM), que les permiten comprender y responder a las instrucciones de los usuarios paso a paso.
La tecnología detrás de los agentes
Este salto conceptual ha sido posible gracias a una serie de avances tecnológicos que han ampliado de forma notable las capacidades de la inteligencia artificial. Guillermo Vieira, responsable de Formación y Engagement en el equipo de Adopción Global de IA de BBVA, resume esta evolución en tres grandes pilares:
- Modelos de razonamiento más sofisticados. La nueva generación de modelos de lenguaje no se limita a generar texto o responder a preguntas. Son capaces de planificar secuencias de acciones, anticiparse a problemas y ajustar su comportamiento en función del contexto. Esto les permite actuar con una lógica más cercana a la toma de decisiones humana.
- Multimodalidad nativa. Los agentes no solo entienden texto. Pueden interpretar imágenes, sonidos, datos estructurados o incluso líneas de código, algo que les permite comprender el entorno e interactuar mejor con las órdenes que reciben.
- Interconexión estandarizada. Para realizar tareas complejas, los agentes de IA deben comunicarse con otros programas y servicios. Esto es posible gracias a protocolos estándar que permiten a la IA interactuar fácilmente, llamar a servicios externos y mantener información de forma continua. «El ‘Model Context Protocol’ (MCP) es una especie de lenguaje común que facilita el intercambio de información entre distintos sistemas de IA. Con estándares como este, los agentes pueden cooperar entre sí o con otras herramientas digitales de forma fluida», observa Vieira.
Gracias a los avances en estos tres pilares, Gartner pronostica que para 2028 el 33% de las aplicaciones empresariales incluirán agentes de IA, un salto notable teniendo en cuenta que en 2024 apenas alcanzaba el 1%. Según la consultora, esto hará posible que cerca del 15% de las decisiones diarias en el trabajo se tomen de forma autónoma.
De hecho, las principales compañías tecnológicas ya tienen sus propios agentes de inteligencia artificial. Es el caso de Microsoft Copilot, que permite integrar agentes (o crearlos a través de Copilot Studio) para a automatizar procesos empresariales; Operator, un agente creado por OpenAI que puede utilizar el navegador para realizar tareas en nombre del usuario, como comprar entradas o rellenar formularios; o Mariner, el proyecto de Google diseñado para navegadores que ayuda con acciones como hacer compras online o reservar billetes de avión.
