Gemini Nano vs Apple on-device: la IA de Google maneja el triple de tokens que la de Apple

Gemini Nano vs Apple on-device: la IA de Google maneja el triple de tokens que la de Apple

Para usar la IA no hay por qué conectarse a Internet: los Google Pixel y iPhone más actuales disponen de sus propios modelos incluidos en el sistema operativo. Eso sí, tienen orientaciones y características diferentes: mientras el Gemini Nano de Google apuesta por la versatilidad, Apple on-device AI se centra en la privacidad. Todo con una ventana de tokens en la que gana ampliamente la IA de Google.

Tanto los Pixel como los iPhone recientes disponen de modelos de IA integrados en el sistema operativo. Esto no solo ahorra datos, también los mantiene a salvo: si la información no sale del teléfono hay menos riesgo de que caiga en otras manos. Ahora bien, hay notables diferencias entre ambas empresas a nivel de IA. Y que Apple vaya por detrás en ese terreno no es lo importante.

La IA de Apple puede manejar la tercera parte de las instrucciones de Gemini Nano

Resumen de llamadas en texto utilizando gemini Nano. Imagen de Google

Las dos empresas desarrollan sus dispositivos poniendo el foco en conjuntar hardware y software, también a nivel de IA; Gemini Nano en el caso de Google y Apple on-device AI en los iPhone y iPad. Ambos modelos se ofrecen como un marco inteligente que los desarrolladores pueden usar para complementar sus aplicaciones. No solo eso, el propio sistema operativo aprovecha las bondades de la IA.

Los Google Pixel utilizan un modelo reducido o destilado del original. Nano está pensado para que la TPU de los procesadores, y la memoria RAM del teléfono, puedan ejecutar los procesos de IA sin calentar el teléfono, con la menor latencia posible y las máximas capacidades que permita su tamaño reducido.

Por su parte, el modelo Apple on-device AI se adapta a la NPU de los iPhone y iPad, mucho más potente y versátil que la TPU de los Google Tensor, adaptada específicamente a la IA de Google. Aun así, la IA de Apple ofrece una ventana de contexto más reducida que Gemini Nano: como destacaron Mishaal Rahman y Peter  Steinberg en X, 12.000 tokens de entrada para Gemini Nano y 4.096 tokens para su contrincante.

Los Pixel pueden administrar más instrucciones que los iPhone, aunque esto tampoco tiene por qué ser implícitamente malo: la mayor parte de las tareas no requiere una carga exagerada de instrucciones. Además, Google y Apple tienen una visión diferente de cómo debe ser un modelo largo de lenguaje anclado al dispositivo. Esto conlleva ventajas e inconvenientes para ambos.

Gemini Nano busca versatilidad, Apple on-device AI privacidad

Resumen de notificaciones aprovechando Apple on-device AI

Google ha destilado un modelo de lenguaje que se especializa en el texto, Apple apuesta por uno multimodal que admite texto e imágenes. Ambos se integran en el sistema operativo ofreciendo un marco inteligente para el propio sistema y para las apps instaladas. ¿Que hacen falta mayores capacidades? Cada uno confía en su propia solución.

Mientras los Google Pixel tienen acceso a los modelos completos de Gemini desde el asistente y en la app, los iPhone deben confiar en terceros, como actualmente ChatGPT. La pasarela de Google es propia, ya que no se intercambian datos con terceras empresas. Por su parte, Apple ha creado un sistema seguro de intercambio llamado Private Cloud Compute.

A continuación dejamos las principales diferencias de ambos modelos de lenguaje. Los dos se encuentran aún en unas fases tempranas de desarrollo: a la IA generativa ejecutada en el dispositivo aún le queda mucho camino por delante.

gemini nano

apple on-device ai

Disponibilidad

Google Pixel 8, Google Pixel 9 y otros Android seleccionados

iPhone 15 Pro y superiores

Ventana de tokens

12.000

4.096

Enfoque Principal

Eficiencia y realización de tareas rápidas en el dispositivo como resúmenes y respuestas inteligente

Privacidad del usuario e integración profunda y contextual en todo el sistema operativo

Generación de Contenido

Principalmente enfocado en texto; como sugerencias de respuesta y resúmenes

Generación de texto (reescribir, resumir, corregir) y de imágenes (Genmoji, Image Playground)

Privacidad

El procesamiento en el dispositivo mantiene los datos sensibles en el teléfono

El procesamiento en el dispositivo mantiene los datos sensibles en el teléfono

interacción con la nube

Recurre a los modelos superiores de Gemini en la nube para tareas más complejas

De necesitar una respuesta ampliada, puede utilizar a ChatGPT tras pedirle permiso al usuario

Imagen de portada | Iván Linares

En Xataka Android | Xiaomi no se conforma con su propio chip. También busca revolucionar el sector de las pantallas con una nueva tecnología


La noticia

Gemini Nano vs Apple on-device: la IA de Google maneja el triple de tokens que la de Apple

fue publicada originalmente en

Xataka Android

por
Iván Linares

.

Salir de la versión móvil