Anthropic lanza una IA capaz de usar el PC por ti: teclea, hace clic y lee la pantalla

Un paso de gigante hacia la automatización

Claude
2 comentarios Facebook Twitter Flipboard E-mail

Anthropic ha dado un paso de gigante en su particular carrera contra OpenAI para liderar el campo de la IA. Y lo ha logrado con el lanzamiento de su nueva actualización de Claude 3.5 Sonnet y Haiku 3.5. Dos modelos que, ahora, no sólo ofrecen mejoras significativas en rendimiento...

...sino que también introducen una funcionalidad que promete transformar la manera en que interactuamos con la IA: el "Modo Ordenador", una nueva funcionalidad permite a Claude controlar un ordenador, imitando acciones humanas como mover el cursor, hacer clic y escribir... algo que podría revolucionar la automatización de tareas digitales.

El Modo Ordenador: un paso hacia la IA autónoma

El Modo Ordenador, aún en fase experimental, se presenta como una herramienta innovadora que permite a la IA controlar las aplicaciones de escritorio, interactuar con ellas y ejecutar tareas de manera autónoma. Varias compañías han explorado ya IAs capaces de navegar por sitios web o realizar comandos de software. Sin embargo, Anthropic ha sido la primera en integrar esta funcionalidad de manera práctica y directa en su modelo Claude.

Según los datos presentados, la IA de Anthropic puede interpretar pantallas y ejecutar comandos como si fuera un usuario humano. En las demostraciones, Claude fue capaz de programar una web, ejecutar scripts en un servidor utilizando VS Code, depurar errores y realizar múltiples acciones simultáneas.

First
Las máquinas ya no sólo entienden el lenguaje natural... también toman el control de las herramientas más versátiles que poseemos: nuestros PCs

La posibilidad de que la IA controle ordenadores tiene profundas implicaciones en múltiples sectores. Desde la automatización de tareas administrativas hasta el desarrollo de software, el Modo Ordenador podría agilizar procesos que actualmente requieren intervención humana constante.

Por ejemplo, como explicó uno de los investigadores de Anthropic en una de sus demostraciones, Claude puede realizar búsquedas en bases de datos, extraer información de hojas de cálculo y rellenar formularios online, todo sin necesidad de supervisión continua.

Los riesgos del Modo Ordenador

El Modo Ordenador, sin embargo, aún está lejos de ser perfecto: su IA puede cometer errores en acciones básicas, como desplazarse o hacer zoom, y puede perderse notificaciones que sólo aparecen por un breve período en la pantalla. Estos errores pueden complicar la automatización de procesos más complejos y requieren de un constante perfeccionamiento.

Además, surge la pregunta de cómo de seguro es permitir que una IA controle directamente nuestros dispositivos. Las pruebas realizadas por Anthropic y otras entidades revelan que los modelos de IA, si son "hackeados" mediante técnicas de jailbreak, pueden realizar acciones perjudiciales. Un estudio reciente mostró que incluso sin acceso directo a aplicaciones de escritorio, modelos como el GPT-4o de OpenAI estaban dispuestos a ejecutar actividades peligrosas, como intentar obtener documentos falsos en la web oscura.

Si bien Anthropic asegura que ha implementado medidas de seguridad, como la retención de capturas de pantalla por 30 días y la posibilidad de restringir el acceso a ciertas funciones, los riesgos de mal uso siguen siendo considerables.

El Modo Ordenador y la competencia

El verdadero desafío de la industria de la IA será hacer que sus agentes sean lo suficientemente rápidos y precisos para gestionar tareas en tiempo real, algo en lo que el nuevo modelo de Anthropic destaca. A pesar de sus fallos en ciertas tareas, Sonnet 3.5 ha demostrado un rendimiento superior en benchmarks clave, superando incluso al GPT-4o de OpenAI en algunas pruebas.

El lanzamiento del Modo Ordenador pone ahora la pelota en el campo de OpenAI, Salesforce y Microsoft, que también están desarrollando tecnologías de agentes de IA. Estos agentes, diseñados para automatizar procesos de software, están siendo vistos como una posible vía para monetizar las enormes inversiones que las empresas tecnológicas han realizado en IA.

Y también Haiku 3.5

Bench Anthropic

Junto con el lanzamiento de Sonnet 3.5, Anthropic ha actualizado su modelo Haiku 3.5, conocido por ser más eficiente y económico. Haiku 3.5 se especializa en tareas específicas como la programación y el manejo de grandes volúmenes de datos, mostrando un rendimiento sobresaliente en benchmarks como el SWE-Bench Verified, donde alcanza un 40,6% de precisión, mejorando notablemente el rendimiento de su predecesor.

Imagen | Marcos Merino mediante IA

En Genbeta | Alguien ha usado la IA para aspirar a 2.843 puestos de trabajo: solo tuvo que escribir un comando y esperar

Inicio