Google acaba de presentar el Gemini 2.5 Computer Use un nuevo modelo de IA diseñado para interactuar directamente con la interfaz web como una persona real.
Soportada por la plataforma Gemini 2.5 Pro esta tecnologia puede guiar el navegador completar formularios desplazar paginas hacer clics en datos e introducir datos y utilizar un conjunto de teclas todo a traves de un navegador virtual desarrollado por Google.
Segun una publicacion oficial en el blog Gemini 2.5 Computer Use se ha proporcionado a los desarrolladores a traves de Google AI Studio y Vertex AI.
El objetivo del modelo es permitir a la IA realizar tareas practicas complejas en Internet basadas en instrucciones en lenguaje natural como el registro de cuentas la organizacion de datos o la prueba de software.
Google dice que el modelo tiene una menor latencia y un rendimiento superior en comparacion con los competidores en muchas pruebas de estandares de web y dispositivos moviles.
En los videos ilustrativos Gemini 2.5 Computer Use muestra la capacidad de procesamiento flexible como que la IA puede acceder a sitios web leer contenido y luego organizar la informacion a peticion del usuario como arrastrar las notas a la posicion correcta en una aplicacion web.
Google dice que estas tareas se han triplicado en comparacion con antes lo que demuestra el progreso de la tecnologia de navegacion y interfaz automatica.
Actualmente el Gemini 2.5 Computer Use solo admite 13 tipos de acciones principalmente en el nivel de navegador y no puede operar directamente en el nivel de sistema operativo de computadora de escritorio.
Sin embargo Google afirma que los grupos tecnicos internos han aplicado este modelo en las pruebas de interfaz de usuario (UI) lo que ayuda a acortar significativamente el tiempo de desarrollo del software.
Esta nueva tecnologia tambien se integra en varios productos y proyectos internos como el Modo de IA en Google Search el controlador Firebase y el proyecto Mariner (plataforma de IA que ayuda a los usuarios a comunicarse en lenguaje natural) para designar a los agentes para que realicen automaticamente tareas como la planificacion la investigacion o la entrada de datos.
Con Gemini 2.5 Computer Use Google esta dando un paso mas para convertir a la IA en un usuario digital real al poder operar responder y procesar informacion directamente en la web lo que abre un futuro donde las tareas en linea se automaticen completamente con inteligencia artificial.