Tecnología

Esta Inteligencia Artificial puede traducir y transcribir cualquier audio

Un nuevo sistema de inteligencia artificial se asoma para seguir cambiando nuestros hábitos y relaciones.

MDZ Estilo
MDZ Estilo jueves, 6 de octubre de 2022 · 07:04 hs
Esta Inteligencia Artificial puede traducir y transcribir cualquier audio
Foto: Pixabay

Ya podemos decir con seguridad que los avances que estamos viendo en Inteligencia Artificial cambiarán nuestras relaciones laborales y muchos trabajos en los próximos años. Nos encontramos en la carrera espacial de la inteligencia artificial y todas las grandes empresas de tecnología están desarrollando sus sistemas. Desde Meta, Google y Microsoft, por ejemplo.

Los sistemas de inteligencia artificial que más se están explorando son los de generación de imágenes. Es decir, que si a estos tipos de sistemas le describimos textualmente una imagen que tenemos en la cabeza, la inteligencia artificial generará rápidamente distintas variaciones de lo que le pedimos.

También existe la inteligencia artificial de generación de videos que funciona de la misma manera que la anterior pero en vez de generar una imagen, generará un video a partir del texto que le solicitemos al sistema.

Una de las compañías de tecnología que lidera los avances en inteligencia artificial es OpenAI. Esta empresa de investigación de inteligencia artificial presentó un tiempo atrás su red neuronal de creación de imágenes llamada DALL.E 2. Esta IA puede crear sorprendentes imágenes de alta resolución de cualquier cosa que se le pida y en distintos estilos. Por ejemplo, "un astronauta montando a caballo al estilo de Andy Warhol":

DALL.E 2

Whisper, el nuevo sistema de OpenAI

La misma compañía de inteligencia artificial que desarrolló uno de los mejores sistema de generación de imágenes conocidos hasta el momento, OpenAI, ha lanzado apenas una semana atrás una nueva red neuronal artificial capaz de traducir y transcribir cualquier audio.

Este nuevo modelo de inteligencia artificial de código abierto llamado Whisper ("Susurro", en su traducción al español) reconoce y traduce audio a un nivel que se acerca a la capacidad de reconocimiento humano. Puede transcribir entrevistas, podcasts, conversaciones y muchas cosas más.

Esta nueva inteligencia artificial de OpenAI, planea revolucionar los traductores y las tecnologías de voz a texto. Según comentan desde la compañía, Whisper es un sistema de reconocimiento automático de voz que se ha entrenado con más de 680.000 horas de datos supervisados ??multilingües y multitarea recopilados de la web. Pero además de escuchar, Whisper también ha tenido que coincidir dichas palabras con texto escrito. 

Además, permite la transcripción en varios idiomas, así como la traducción de esos idiomas al inglés. "Somos modelos de código abierto y código de inferencia que sirven como base para crear aplicaciones útiles y para futuras investigaciones sobre procesamiento de voz sólido", explican desde OpenAI.

Desde OpenAI esperan que Whisper pueda introducir un nuevo modelo básico que otros puedan aprovechar en el futuro para mejorar el procesamiento del habla y las herramientas de accesibilidad. 

Como todos estos nuevos modelos de inteligencia artificial que están en auge, podrían usarse para el mal y será imprescindible un debate ético y moral sobre estas tecnologías antes de lanzarse públicamente. 

En el código de Whisper, sus creadores comentan que es una herramienta que podría usarse también para el mal. Por ejemplo, para identificar interlocutores en una conversación o incluso para automatizar la vigilancia. Sin embargo, desde OpenAI esperan que se use para el bien y permita a desarrolladores crear herramientas de traducción y transcripción mucho más complejas. 

Podríamos asegurar que la inteligencia artificial de generación de imágenes cambiará la industria de imágenes de archivos, modificará el trabajo de publicistas, diseñadores gráficos y artistas. La inteligencia artificial de generación de videos modificará el trabajos de editores y cineastas. Y por último, la inteligencia artificial de traducción y transcripción de audio modificará el trabajo de periodistas y traductores, por nombrar solo algunos trabajos. 

Archivado en