La forma en que interactuamos con el contenido audiovisual está a punto de cambiar drásticamente. Google acaba de lanzar una actualización que dota a su inteligencia artificial, Gemini, de una capacidad sorprendente: interpretar videos y responder preguntas sobre su contenido. Preparate para una nueva era de interacción visual, donde tu asistente de IA no solo te escucha, sino que también «ve» lo que vos le mostrás.

Cómo funciona esta magia tecnológica
Imagina tener un asistente que puede procesar visualmente la información de un video en segundos. Con esta nueva función, Gemini te permite decirle adiós a las maratones de reproducción para encontrar un dato o entender un concepto. La mecánica es asombrosamente sencilla: abrí el chat de Gemini, tocá el ícono para adjuntar archivos, seleccioná el video de tu galería y formulale una pregunta en lenguaje natural. En cuestión de segundos (quizás un poco más si el archivo es muy grande), Gemini te devolverá un resumen, identificará objetos, describirá acciones o te dará el contexto que necesitás.
Esta característica, disponible sin costo en todas las versiones de Gemini (web, Android y iPhone), busca que la inteligencia artificial «piense como un humano» al analizar imágenes en movimiento. Es un salto gigante hacia una interacción más intuitiva y eficiente con la avalancha de contenido audiovisual que consumimos a diario.

Gemini, al igual que otras IAs son excelentes aliadas para estudiantes, porque genera resumenes de clases grabadas y aclaran complejos conceptos académicos; también garantizan la accesibilidad de personas con discapacidad visual que podrán solicitar descripciones detalladas de grabaciones, abriendo una puerta invaluable al contenido multimedia. Gemini puede ayudarte a resolver problemas y crear contenido. El objetivo es claro, ahorrar tiempo y ampliar el acceso a la información que reside dentro de los videos
Para aquellos que requieren un análisis más profundo y específico, Gemini Advanced eleva la apuesta con DeepResearch. Esta herramienta, diseñada para investigaciones académicas o técnicas, permite estructurar trabajos, encontrar fuentes verificadas y redactar textos complejos en pocos pasos. Si te interesa la tecnología de sensores para vehículos autónomos, por ejemplo, DeepResearch puede buscar papers sobre LiDAR, radar o visión computarizada, resumir tendencias y generar un informe completo. Podés activarla manualmente desde la app de Gemini en Android.
Con esta innovación, Google no solo mejora una de sus inteligencias artificiales más prometedoras, sino que también nos acerca a un futuro donde la interacción con la información visual es tan fluida y natural como la conversación.