Poner tuercas no es divertido, pero durante años eran empleados de una cadena de montaje los que lo hacían. Los robots acabaron reemplazando a los seres humanos en muchos de esos procesos, y hace años que se busca hacer lo mismo en tareas que se realizan delante de un ordenador y son igualmente repetitivas.
Robotic Process Automation (RPA). Esta disciplina combina el uso de las APIs (Application Programming Interfaces) con interacciones con la interfaz de usuario de un ordenador. El objetivo, realizar tareas repetitivas en aplicaciones de productividad y, sobre todo, empresariales.
Emulando la interacción humana. Esos procesos intentan completar la ejecución autónoma de diversas actividades y transacciones en todo tipo de sistemas software. La idea es emular la interacción de un usuario humano y reproducirla, evitando así invertir tiempo en eso para ocuparlo en tareas más complejas y así generar mayor retorno de la inversión por parte de los empleados.
RPA no era IA (pero ahora sí). Hasta ahora este tipo de automatización no podía ser considerada como un sistema de inteligencia artificial porque la RPA está basada en procesos, y la IA está centrada en datos. Anthropic y su nueva función ‘Computer Use’ acaban de demostrar que ambas cosas pueden combinarse, y es posible automatizar interacciones con la interfaz de usuario para ejecutar todo tipo de tareas repetitivas.
En Anthropic lo tienen claro. Mike Krieger, directivo de Anthropic, planteó las posibilidades de esta función en una entrevista con VentureBeat. Explicó que «prevemos que será especialmente útil para tareas como la investigación en línea, la realización de procesos repetitivos como la prueba de nuevos programas informáticos y la automatización de tareas complejas de varios pasos». ¿Y a quién le encanta automatizar tareas complejas? Exacto. A las empresas.
Un caramelo empresarial. La función ‘Computer use’ es capaz de reconocer lo que está en pantalla para actuar en consecuencia. El nivel de automatización es prometedor para sectores como el financiero, pero también para para servicios legales y soporte de cliente. Krieger explicaba que «Claude puede abrir hojas de cálculo hacer análisis y crear visualizaciones. Para los servicios de atención al cliente, podrá navegar por sistemas CRM para encontrar y actualizar información de cualquier cliente».
Y un potencial enorme. Características como esta plantean una solución prometedora para la entrada de datos, o los servicios de soporte y atención al cliente, pero esa automatización puede ir mucho más allá al poder reconocer y analizar la información que ve en pantalla para luego actuar sobre ella. Es precisamente lo que prometen los agentes de IA, y este puede ser un gran ejemplo inicial de su capacidad.
Pero. De momento ‘Computer Use’ está disponible de forma limitada, y como aclaran en Anthropic «no puede usar tu PC como tal». La herramienta está disponible como parte de un entorno aislado en el que podremos ejecutar todo tipo de tareas con movimientos de ratón y pulsaciones de teclas autónomas y generadas por la IA. Aun así, en Anthropic han desarrollado mecanismos para detectar si la característica se está usando para actividades peligrosas, como posibles interacciones malintencionadas con portales gubernamentales, por ejemplo. El poder de la herramienta ciertamente también se puede utilizar para usos malévolos, como estamos viendo con la IA generativa y los deepfakes.
En Xataka | Microsoft comienza a ofrecer agentes de IA autónomos. De momento son recetas IFTTT hipervitaminadas