Tecnología

Locutores advierten sobre el avance de la inteligencia artificial y las voces sintéticas

El video de Messi hablando en inglés realizado por inteligencia artificial dejó al descubierto el uso que esta herramienta puede tener para la clonación sin permiso de la voz. Este fue uno de los ejes de discusión de un encuentro de locutores de todo el país que se realizó días atrás.

Gabriela Yalangozian
Gabriela Yalangozian sábado, 16 de septiembre de 2023 · 18:43 hs
Locutores advierten sobre el avance de la inteligencia artificial y las voces sintéticas
La inteligencia artificial en las voces viene desde hace algún tiempo, advierten los locutores nacionales Foto: Freepik

En las utimas horas se viralizó el video de Lionel Messi hablando en inglés con una clonación de voz lograda a través de la inteligencia artificial, Si bien el clip hizo reír a todos los fanáticos del astro del fútbol, que la IA haya logrado un parecido impresionante de su voz -a tal punto que hizo dudar a muchos en las redes sociales- dejó al descubierto el uso que puede tener esta herramienta. En especial, el potencial que se abre para la manipulación sin permiso de la voz, no sólo de figuras reconocidas, sino también de locutores, cuya interpretación oral es su marca registrada para el desarrollo de su profesión.

Si bien es cierto que la inteligencia artificial es motivo permanente de debate. Su desarrollo es tan rápido que llama a la reflexión sobre qué profesiones puede estar en peligro y porqué es que necesita ser reglamentado su uso. Es en este marco que días atrás se desarrolló el Encuentro Nacional de Locutores, un evento de 16 años de trayectoria en el país, en el Complejo Norte de la ciudad cordobesa de Río Segundo.

En el mismo, se debatió en torno a la posibilidad de que la IA pueda copia la voz de un profesional imitando su tono, además de poder crear guiones, textos y difundir publicidades.

Paul Guzmán, uno de los organizadores de este encuentro donde se congregaron más de 200 locutores de todas las provincias, conversó con MDZ sobre algunos ejes de reflexión en torno al avance de esta herramienta y el futuro de la profesión.

En un encuentro nacional de locutores se reflexionó en torno a la posibilidad de que la IA pueda copia la voz de un profesional imitando su tono. Crédito: Paul Guzmán

“Analizamos lo que está pasando con las voces y la inteligencia artificial, y sobre la generación de textos, la programación o la creatividad que también se ven amenazadas por la IA. Además, vimos que el alcance es enorme en todos los rubros de la locución y del doblaje. Seguramente van a quedar muchos aspectos por hablar, pero existe una preocupación en torno a las clonaciones de voz y la falta de pago de los derechos. Hay algunos estudios de grabación o algunos pícaros editores de audio que clonan las voces de locutores, colegas de mucho renombre, evitando el pago de los cánones, de los contratos y las licencias”, precisó Guzmán.

Mirá el video de Lionel Messi hablando en inglés gracias a la intervención de una IA

Por el otro lado, también se habló sobre la explosión de lo que llaman “voces sintéticas” o “ genéricas”, y de las páginas que venden los bancos de voces y el uso que se hace de estas tonalidades robóticas en redes sociales como TikTok, por ejemplo.

“Esas son voces que no son de nadie, que son creadas por una máquina. Junto con la clonación de las voces, la voz sintética es otro de los problemas que estamos advirtiendo, por la posibilidad de que ocupen a futuro el lugar de un locutor”, indicó Guzmán.

La clonación es un delito

Respecto a la clonación de voces, el locutor fue contundente a señalar que es “un delito”. “La clonación sin permiso, sin el pago de licencia de una voz es un robo de identidad. Que a mí me clonen la voz y la ofrezcan a Cosquín Rock para grabar una publicidad con un tono parecido al mío, seguramente le va a salir más barato al cliente. La máquina no se cansará, hará las 24 horas de trabajo sin tomarse un break para almorzar o cenar. Pero, por otro lado, está la suplantación de identidad de las personas comunes que no son conocidas, y a las que les clonan la voz para hacer estafas, para cometer delitos. Tal es el caso de la clonación de voz de un nieto que llama a la abuela desesperado pidiéndole dinero o alguien enviando audios en una red social haciéndose pasar por amigo tuyo con la voz parecida. Acá no es solamente es la pelea entre el locutor y la máquina, sino que también hay un problema bastante grave de seguridad”, enfatizó.

Paul Guzmán advirtió que hay casos donde en vez de hablar de inteligencia artificial debería hablarse de ´Manipulación artificial´. Crédito: Paul Guzmán

“Si bien en estos casos también se trata de inteligencia artificial, en realidad deberíamos hablar de ´manipulación artificial´. Porque todavía la máquina o la computadora no piensa por sí sola. Tiene que haber una persona del otro lado que la manipule, que digite lo que tiene que hacer la IA. Y su uso termina dependiendo de la ética, de la moral y de los principios de la persona que utilice la inteligencia artificial”, apuntó Guzmán.

Por el lado de las voces sintéticas, tanto de hombre como de mujer, tan habituales en los últimos tiempos en TikTok, el locutor indicó: “Por el momento, quienes utilizan este recurso son personas que no pueden poner la voz porque no tienen la posibilidad de grabarse o creen que sus voces salen horribles en un video. Es gente común y corriente y no empresas las que están utilizando voces artificiales. Por suerte, las empresas continúan con seriedad apostando el trabajo la creatividad humana”, reflexionó.

El futuro de la profesión

Para Guzmán, en este desarrollo vertiginoso que está teniendo la IA, no todas son contras. “No es todo negro en el futuro del locutor. Si bien las voces sintéticas todavía no están a la altura de la voz humana, la falta de matices, de interpretación, los tonos, la intensidad, el ritmo que por ahí necesita uno para poder interpretar un texto, no son asimilables por la computadora todavía”, aseveró.

Para respaldar su teoría, Paul Guzmán hizo una práctica con hice tres ejemplos durante el encuentro de locutores en Río Segundo. “Tomé una publicidad que grabé hace poquito para Cosquín Rock, y puse tres ejemplos: primero, escuchamos la voz mía, interpretando el texto. Después el mismo texto en una voz sintética parecida a la mía, y por último cloné mi voz por medio de un programa que compré la semana pasada, para ver cuál era el resultado. Como conclusión, podemos decir que interpretación no es la misma. Todavía le falta bastante a la IA. Incluso se demora muchísimo en crear algo medianamente parecido a la voz humana, por los matices principalmente que le damos los locutores a un texto para darle una intención a cada frase. Lleva mucho tiempo de manejo, y la inteligencia artificial por ahí te toma la zeta en forma literal o, en Argentina que no se utiliza, la doble L sino que nosotros usamos la Y griega. Y la computadora no lo sabe discernir. Inclusive el punto y aparte o las comas, se la lleva puestas”, explicó Guzmán.

La reflexión en el Encuentro de locutores es que una máquina no puede reemplazar al ser humano: "no tiene talento, no tiene espíritu, no tiene carisma". Crédito: Paul Guzmán

Y concluyó: “Es un trabajo bastante engorroso para un operador que quiera interpretar a través de una voz sintética, la de una persona. De todas formas, esto que estamos viviendo hoy con la IA no es algo nuevo. La inteligencia artificial en las voces viene desde hace rato. Las primeras voces robóticas se pudieron escuchar en el famoso texto speech de Google, el traductor de Windows o de algunas aplicaciones para no videntes. Del mismo modo, con el contestador automático que tiene una voz artificial, por así decirlo. Lo que pasa es que hoy se puso de moda hablar pura y exclusivamente hablar de la inteligencia artificial porque es como el boom”, especuló.

Denuncia al ENACOM

Uno de los disertantes e integrantes del encuentro de locutores fue Sebastián Llapur, miembro activo de Organización de Voces Unidas; una organización activa internacionalmente que está trabajando en la creación de leyes de regulación del IA y su implementación a nivel internacional.

“Ya están trabajando principalmente en México y Estados Unidos, donde es muy fuerte el doblaje, que es uno de los rubros más perjudicados por el avance de la inteligencia artificial hoy en día”, contó Guzmán.

A nivel nacional, el locutor contó que el Sindicato Argentino de Locutores y Comunicadores (SALCO), es hasta el momento el único que emitió un comunicado en el que se refieren a algunas plataformas que están promocionando el servicio de conversión de texto a voz y ha hecho una denuncia en el Ente Nacional de Comunicaciones (ENACOM). “Seguramente, la misma tendrá resolución en las próximas semanas”, señaló.

Respecto a la proyección que los locutores realizan de su futuro profesional, Guzmán fue contundente: “La inteligencia artificial no tiene talento, no tiene espíritu, no tiene carisma. No piensa por sí sola. Incluso hay algunos casos de inteligencias artificiales que hacen de reporteros en un canal de televisión, y la gente se da cuenta que es una máquina la que está hablando del otro lado. Es como si estuvieras hablando con un contestador automático. Hoy en día es difícil imaginar a Marcelo Tinelli reemplazado por una inteligencia artificial haciendo el Bailando. Ni a Mario Pergolini o a Lalo Mir siendo reemplazados por una máquina con una voz parecida”, descartó Guzmán.

Archivado en