Google presenta Gemini Omni, su nuevo modelo nativo para crear y editar videos
La compañía tecnológica lanzó una herramienta de inteligencia artificial capaz de procesar múltiples formatos para generar piezas audiovisuales realistas.
Google presentó lo nuevo de su IA: videos e imágenes.
ShutterstockLa empresa estadounidense Google expandió las fronteras de sus sistemas virtuales mediante un desarrollo enfocado en el terreno multimedia. El nuevo modelo Gemini Omni unifica la capacidad de razonamiento lógico con la generación de contenidos complejos, permitiendo la creación de producciones audiovisuales de alta fidelidad desde el navegador web.
Edición conversacional de video con Gemini Omni
La característica principal de esta plataforma radica en su estructura nativa multimodal, diseñada desde las bases para procesar información de distinta naturaleza.
Los usuarios poseen la alternativa de combinar imágenes fijas, pistas de audio, clips de video y archivos de texto para obtener un único resultado integrado que respeta las leyes físicas del entorno.
El proceso de edición se realiza mediante el uso del lenguaje natural, eliminando los comandos de software tradicionales. Cada indicación que añade el operador se apoya en la instrucción anterior, lo que garantiza que los personajes mantengan la consistencia visual y que la escena recuerde el contexto previo. El modelo de Google permite modificar elementos específicos dentro de una filmación propia, cambiar los fondos por completo o alterar las acciones de los protagonistas sin perder la base del encuadre original.
Distribución del software y medidas de seguridad
La firma tecnológica inició el despliegue de la primera variante de esta familia bajo el nombre de Gemini Omni Flash. Esta herramienta se encuentra disponible para los suscriptores de los planes premium de la organización y se integrará de forma gratuita en plataformas masivas como YouTube Shorts para la creación de contenidos cortos. Los desarrolladores de software independientes y los clientes corporativos accederán a estas funciones mediante interfaces de programación de aplicaciones durante las próximas semanas.
Para evitar la propagación de desinformación o contenidos manipulados, la empresa aplica protocolos de verificación técnica en cada archivo resultante. Los videos generados por el sistema incorporan SynthID, una marca de agua digital imperceptible para el ojo humano que resiste los procesos de edición posteriores. La autenticidad de las piezas audiovisuales se puede constatar de forma directa a través del buscador general y de las extensiones oficiales del navegador Chrome, facilitando la transparencia informativa en internet.
La plataforma también habilita la creación de avatares digitales personalizados que reproducen la voz y los movimientos de los propios usuarios bajo pautas estrictas de responsabilidad legal. El desarrollo técnico contempla una comprensión intuitiva de la gravedad y la dinámica de fluidos para otorgar un mayor realismo a las animaciones de simulación científica. Esta combinación de bases de datos culturales y creatividad marca una pauta en el avance de la inteligencia artificial aplicada a la comunicación.



