Gemini ahora puede ‘escuchar’ archivos de audio, y me ha sorprendido lo útil que puede ser. Así funciona

Gemini ahora puede 'escuchar' archivos de audio, y me ha sorprendido lo útil que puede ser. Así funciona

Gemini acaba de ganar otro poder, y puede ser muy útil tanto para profesionales como para estudiantes. La inteligencia artificial de Google ahora puede ‘escuchar’ los archivos de audio, algo que hasta ahora no era posible. Dicho de otro modo, podemos cargar un archivo de audio en cualquier formato compatible y pedirle que realice acciones basadas en su contenido, incluyendo transcribirlo.

La nueva función ya está disponible para todos los usuarios de Gemini, aunque con ciertas diferencias entre los usuarios de la app de forma gratuita y los usuarios que pagan una suscripción. Esto es lo que hay que saber.

Gemini ahora soporta archivos de audio: qué puede hacer y cómo usar esta función

Gemini está evolucionando a un paso acelerado. Google este año no solo llevó su IA a más dispositivos, incluyendo relojes inteligentes (y pronto también llegará al hogar), sino que ha añadido herramientas muy útiles como la nueva creación y edición de imágenes con NanoBanana. Ahora, el último cambio en Gemini le permite escuchar los audios que compartimos con la IA.

A partir de ahora, es posible cargar un archivo de audio en los formatos más utilizados (MP3, M4A, WAV y otros) para que la IA los analice y pueda realizar acciones en base a su contenido, dependiendo de lo que le pedimos.

Por ejemplo, podemos cargar un audio y pedirle a Gemini que nos explique su contenido y lo resuma. En mis primeras pruebas, hice una grabación de mi lectura del artículo «El Android que conocemos no sería igual sin la aplicación Nova Launcher. Después de 13 años, su creador la abandona» que publicamos en Xataka Android. Solamente leí la mitad del artículo, y le pedí a Gemini que resuma y me explique lo que dice el audio.

La respuesta de Gemini me sorprendió porque no solo resumió el contenido del archivo (que, como ya mencioné, solamente incluía la mitad del artículo en cuestión), sino que dado que le pedía que me lo explicara, claramente buscó más información en la web para darme una mejor explicación de lo que está pasando con el Launcher.

Por supuesto, también podemos pedirle que, sencillamente, transcriba de forma literal el contenido del audio. Esto puede ser muy útil para las personas que, por ejemplo, graban una conferencia o una entrevista, incluso una clase; con Gemini es posible obtener una transcripción e incluso una lista de los puntos más importantes del audio.

Además de transcribir y resumir los audios, quise comprobar qué más podía hacer Gemini con su contenido, por lo que le pedí que creara una imagen en base al contenido del archivo de audio. Efectivamente, hizo justo lo que le pedí, y creó una imagen bastante graciosa que representa, en cierto modo, el fin del desarrollo del Launcher que menciona el audio.

Por último, también le pedí que traduzca el contenido del archivo de audio de forma literal, algo que también pudo hacer.

¿Qué límites tiene esta función y dónde se puede usar?

Google explica en su web de soporte oficial que Gemini soporta archivos de audio de hasta 10 minutos para los usuarios de cuentas gratuitas, y hasta 3 horas en el caso de los usuarios con una suscripción a Google AI Pro o Google AI Ultra.

La función de ‘escuchar’ archivos de audio ya está disponible para todos los usuarios, tanto en Gemini para el escritorio como en la aplicación para Android y para iOS. El lanzamiento es progresivo, por lo que si todavía no puedes usar esta función en tu dispositivo móvil, en las próximas horas, o días, se activará esta función.

Foto de portada | Xataka (con edición)

En Xataka Android | Gemini Live se ha convertido en mi asistente personal para el trabajo. Así es cómo uso la IA de Google y me ahorra tiempo valioso

En Xataka Android | La revolución de Gemini de Google empieza por los Gems. Qué son y cómo crear los tuyos


La noticia

Gemini ahora puede ‘escuchar’ archivos de audio, y me ha sorprendido lo útil que puede ser. Así funciona

fue publicada originalmente en

Xataka Android

por
Eduardo Marín

.

Salir de la versión móvil