Presenta:

Google Gemini 3.5 Live Translate: la nueva traducción simultánea de voz

Google presenta un sistema de conversación instantánea que conserva la entonación del usuario y procesa más de 70 idiomas.

El nuevo sistema de traducción simultánea de Google asiste a los usuarios para sostener conversaciones fluidas en más de 70 idiomas sin retrasos lógicos.

El nuevo sistema de traducción simultánea de Google asiste a los usuarios para sostener conversaciones fluidas en más de 70 idiomas sin retrasos lógicos.

Google Blog

El desarrollo de sistemas de comunicación global registra un avance técnico dentro del segmento corporativo en Google. La empresa de Mountain View presentó Gemini 3.5 Live Translate, un modelo diseñado para efectuar traducciones instantáneas de voz a voz con baja latencia y un comportamiento natural en entornos virtuales.

La expansión del modelo lógicos en el ecosistema de Google

Presentando Gemini 3.5 Live Translate

Esta variante forma parte de la familia de soluciones que la compañía exhibió en su conferencia anual I/O. El motor funciona como un esquema de habla a habla calibrado para identificar y procesar de manera automática el diálogo de los interlocutores en más de 70 lenguas diferentes. El sistema reduce los tiempos de espera a unos pocos segundos, logrando copiar el ritmo de la conversación, las pausas y el tono de quien emite el mensaje.

La tecnología de inteligencia artificial optimiza el procesamiento de datos de forma continua. La firma estadounidense habilitó el ingreso a estas líneas de código mediante una vista previa pública en su interfaz de desarrollo de software y en la plataforma AI Studio. El circuito filtra el ruido de fondo de los ambientes laborales concurridos, evitando que las computadoras sufran errores de interpretación semántica ante sonidos imprevistos de la calle o de oficinas comerciales.

Aplicación en videollamadas y medidas de seguridad digital

Embed - Speech translation in Google Meet with Gemini 3.5 Live Translate

Los clientes corporativos de la firma contarán con acceso a esta herramienta dentro de las salas virtuales de Google Meet a partir de este mes, previo a su distribución general en las tiendas de telefonía móvil. La interfaz de videoconferencias modificará su disposición gráfica para colocar la función en el plano principal de control. Asimismo, el mecanismo de traducción simultánea arribará pronto a la aplicación oficial de traducción para las plataformas de los celulares Android e iOS.

Los usuarios de las herramientas móviles disponen de una modalidad denominada modo escucha. Este formato faculta a sostener el teléfono contra la oreja como si fuera una llamada telefónica tradicional para percibir el mensaje traducido, eliminando la obligación de utilizar auriculares de manera complementaria. Los voceros técnicos detallaron que esta función específica de escucha opera únicamente en terminales Android durante esta primera fase de despliegue comercial.

Gemini - Interna 1
Las herramientas de inteligencia artificial de Google se incorporan al panel de videollamadas para facilitar las reuniones de negocios internacionales.

Las herramientas de inteligencia artificial de Google se incorporan al panel de videollamadas para facilitar las reuniones de negocios internacionales.

La generación de audio por intermedio de inteligencia artificial plantea desafíos normativos para la corporación. Para evitar falsificaciones de identidad, todos los archivos de sonido emitidos por el motor integrarán la marca de agua digital SynthID dentro de los datos de su onda física. Esta huella electrónica resulta imborrable con los métodos de edición actuales y califica al flujo de voz como un producto generado por computadoras.