Presenta:

Google presenta Gemini Omni, su nuevo modelo nativo para crear y editar videos

La compañía tecnológica lanzó una herramienta de inteligencia artificial capaz de procesar múltiples formatos para generar piezas audiovisuales realistas.

Google presentó lo nuevo de su IA: videos e imágenes.

Google presentó lo nuevo de su IA: videos e imágenes.

Shutterstock

La empresa estadounidense Google expandió las fronteras de sus sistemas virtuales mediante un desarrollo enfocado en el terreno multimedia. El nuevo modelo Gemini Omni unifica la capacidad de razonamiento lógico con la generación de contenidos complejos, permitiendo la creación de producciones audiovisuales de alta fidelidad desde el navegador web.

Edición conversacional de video con Gemini Omni

El entorno de Gemini Omni interpreta instrucciones secuenciales en lenguaje natural para modificar objetos y fondos en una filmación.

La característica principal de esta plataforma radica en su estructura nativa multimodal, diseñada desde las bases para procesar información de distinta naturaleza.

Koray Kavukcuoglu, director de tecnología de Google DeepMind, detalló en la presentación oficial que el sistema "puede crear cualquier cosa a partir de cualquier entrada, comenzando con el video". Koray Kavukcuoglu, director de tecnología de Google DeepMind, detalló en la presentación oficial que el sistema "puede crear cualquier cosa a partir de cualquier entrada, comenzando con el video".

Los usuarios poseen la alternativa de combinar imágenes fijas, pistas de audio, clips de video y archivos de texto para obtener un único resultado integrado que respeta las leyes físicas del entorno.

El proceso de edición se realiza mediante el uso del lenguaje natural, eliminando los comandos de software tradicionales. Cada indicación que añade el operador se apoya en la instrucción anterior, lo que garantiza que los personajes mantengan la consistencia visual y que la escena recuerde el contexto previo. El modelo de Google permite modificar elementos específicos dentro de una filmación propia, cambiar los fondos por completo o alterar las acciones de los protagonistas sin perder la base del encuadre original.

Distribución del software y medidas de seguridad

Embed - Introducing Gemini Omni

La firma tecnológica inició el despliegue de la primera variante de esta familia bajo el nombre de Gemini Omni Flash. Esta herramienta se encuentra disponible para los suscriptores de los planes premium de la organización y se integrará de forma gratuita en plataformas masivas como YouTube Shorts para la creación de contenidos cortos. Los desarrolladores de software independientes y los clientes corporativos accederán a estas funciones mediante interfaces de programación de aplicaciones durante las próximas semanas.

Para evitar la propagación de desinformación o contenidos manipulados, la empresa aplica protocolos de verificación técnica en cada archivo resultante. Los videos generados por el sistema incorporan SynthID, una marca de agua digital imperceptible para el ojo humano que resiste los procesos de edición posteriores. La autenticidad de las piezas audiovisuales se puede constatar de forma directa a través del buscador general y de las extensiones oficiales del navegador Chrome, facilitando la transparencia informativa en internet.

Gemini Omni
El entorno de Gemini Omni interpreta instrucciones secuenciales en lenguaje natural para modificar objetos y fondos en una filmación.

El entorno de Gemini Omni interpreta instrucciones secuenciales en lenguaje natural para modificar objetos y fondos en una filmación.

La plataforma también habilita la creación de avatares digitales personalizados que reproducen la voz y los movimientos de los propios usuarios bajo pautas estrictas de responsabilidad legal. El desarrollo técnico contempla una comprensión intuitiva de la gravedad y la dinámica de fluidos para otorgar un mayor realismo a las animaciones de simulación científica. Esta combinación de bases de datos culturales y creatividad marca una pauta en el avance de la inteligencia artificial aplicada a la comunicación.