Google presenta sus primeras gafas inteligentes de audio y Gemini Omni crea vídeos con el usuario dentro

En el Google I/O 2026, Google mostró sus primeras gafas inteligentes solo de audio, Android 17 y dos novedades de IA: Gemini 3.5 Flash y Gemini Omni.

20 de mayo de 2026 a las 10:22h
Google presenta sus primeras gafas inteligentes de audio y Gemini Omni crea vídeos con el usuario dentro
Google presenta sus primeras gafas inteligentes de audio y Gemini Omni crea vídeos con el usuario dentro

El 19 de mayo arrancó en California el Google I/O 2026. La compañía no llegó sola a la cita.

Siete días antes, durante el Android Show: I/O Edition 2026, Android 17 tomó el protagonismo como sistema operativo base. Esta presentación previa marcó el tono para una semana cargada de novedades técnicas y estratégicas por parte del gigante tecnológico.

Google estrena sus primeras gafas inteligentes de audio

La gran sorpresa hardware fueron las primeras gafas inteligentes de Google. El dispositivo, que por el momento se limita a ser un modelo de solo audio, representa la incursión formal de la compañía en el sector de la wearables ópticas. Aunque carecen de pantalla visual, su diseño busca integrar la asistencia digital en la rutina diaria sin depender exclusivamente de la mirada hacia una pantalla móvil.

Este lanzamiento responde a la necesidad de ofrecer interfaces más naturales. Al eliminar la componente visual inmediata, Google apuesta por la interacción auditiva como puente entre el usuario y la inteligencia artificial que opera en segundo plano.

Gemini Omni genera vídeos con el usuario como protagonista

En el terreno del software, la inteligencia artificial copó los titulares con dos nuevas iteraciones. Los ingenieros presentaron Gemini 3.5 Flash, una versión optimizada para velocidad y eficiencia, junto a Gemini Omni. Este último destaca por su capacidad multimodal avanzada.

Gemini Omni permite crear todo tipo de vídeos mediante instrucciones complejas. La característica más llamativa reside en su habilidad para incluir al propio usuario dentro de las escenas generadas. Esta función transforma la creación de contenido audiovisual en un proceso personalizado donde la identidad digital del creador se integra directamente en la narrativa sintética.

La tecnología subyacente requiere procesar grandes volúmenes de datos visuales y contextuales en tiempo real. Al poner al usuario en el centro de la acción, el modelo difumina la línea entre la grabación tradicional y la generación algorítmica.

La IA redefine la creación de contenido personal

La convergencia entre hardware auditivo y modelos de generación de vídeo sugiere un cambio en cómo consumimos información. Las gafas de audio podrían servir como canal de entrada para interactuar con sistemas como Gemini Omni sin necesidad de teclear o hablar frente a un micrófono visible.

Esta estrategia une la potencia de cálculo en la nube con dispositivos discretos en el cuerpo. El ecosistema resultante depende menos de la atención visual constante y más de la asistencia contextual continua.

El evento confirmó que la batalla actual no solo se libra en la precisión de los algoritmos. La forma en que estos modelos se integran en objetos cotidianos, como unas gafas o un teléfono con Android 17, determinará su adopción real.

Sobre el autor
Redacción
Ver biografía