Los datos inventados en la inteligencia artificial

29 de junio de 2024 · 07:00 hs

Foto: Shutterstock

La data sintética es información generada artificialmente mediante algoritmos y simulaciones. A diferencia de los datos auténticos, que se recopilan del mundo real, los sintéticos se crean usando programas que imitan situaciones reales.

Te puede interesar

Adaptarse o quedar atrás: el desafío de modernizar las reglas del mercado

Estos datos pueden incluir imágenes, textos, números, o cualquier tipo de información que se utiliza para entrenar y mejorar sistemas de inteligencia artificial (IA).

El uso de datos sintéticos en el entrenamiento de modelos de inteligencia artificial (IA) tiene varias ventajas importantes:

Te puede interesar

El futuro del ecommerce: operaciones agénticas con inteligencia artificial

Más datos disponibles: a veces, no hay suficientes datos reales para entrenar a las IAs. Por ejemplo, si queremos que una IA reconozca enfermedades raras, puede ser difícil encontrar suficientes casos reales. Los datos sintéticos llenan estos vacíos.
Protección de la privacidad: en áreas como la salud o las finanzas, es importante mantener la privacidad de las personas. Usar datos sintéticos permite entrenar a las IAs sin comprometer información personal sensible.
Diversidad de escenarios: los datos reales no siempre cubren todas las situaciones posibles. Los datos sintéticos pueden crear escenarios variados y asegurarse de que las IAs aprendan a manejar diferentes condiciones y situaciones.
Reducción de sesgos: los datos reales pueden tener sesgos, es decir, pueden estar desequilibrados y no representar bien todas las posibilidades. Los datos sintéticos pueden balancear estos sesgos y mejorar la equidad en los modelos de IA.
Menor costo y mayor rapidez: crear datos sintéticos puede ser más barato y rápido que recopilar y etiquetar grandes cantidades de datos reales, acelerando el proceso de desarrollo de IAs.
Los datos son secretos: en aplicaciones militares hay datos que no pueden utilizarse, en ese caso, la generación sintética permite entrenar modelos en ese campo sin poner en riesgo información sensible.

Sin embargo, el uso de datos sintéticos también tiene desventajas que debemos considerar:

Falta de realismo: los datos sintéticos pueden no reflejar la complejidad del mundo real. Esto puede hacer que las IAs no funcionen tan bien en situaciones reales.
Dependencia en la calidad de la simulación: la calidad de los datos sintéticos depende de la precisión de los algoritmos que los generan. Si estos algoritmos no son buenos, los datos pueden ser de baja calidad.
Posibles nuevos sesgos: aunque los datos sintéticos pueden reducir ciertos sesgos, también pueden introducir nuevos si no se diseñan cuidadosamente.
Dificultad en validación: es difícil asegurar que los datos sintéticos sean verdaderamente representativos del mundo real. Validar su precisión es un desafío constante.

Gartner, una firma de investigación, predice que para el año 2030, la mayoría de las aplicaciones de IA utilizarán datos sintéticos. Este cambio trae tanto oportunidades como riesgos:

Calidad de la data: si la mayoría de los datos son sintéticos, debemos asegurar que estos sean de alta calidad para que las IAs funcionen correctamente.
Evolución de las técnicas de generación de datos: las técnicas de creación de datos sintéticos deben seguir mejorando para simular la realidad de manera más precisa.
Balance entre datos reales y sintéticos: es crucial combinar datos reales y sintéticos para mantener la relevancia y efectividad de las IAs.
Regulación y normativas: podrían surgir nuevas leyes y regulaciones que aseguren el uso responsable y ético de los datos sintéticos.

Recientemente, NVIDIA lanzó un nuevo sistema avanzado para crear datos sintéticos. Este sistema utiliza tecnología de punta para generar datos de alta calidad, ayudando a resolver muchos de los problemas mencionados anteriormente. Las ventajas de este sistema incluyen:

Mayor realismo: utiliza técnicas avanzadas de simulación y aprendizaje para crear datos que son muy similares a los del mundo real.
Reducción de sesgos: el sistema está diseñado para minimizar sesgos y crear datos más equilibrados y representativos.
Rapidez y eficiencia: permite generar grandes cantidades de datos en poco tiempo, acelerando el desarrollo y entrenamiento de IAs.
Flexibilidad y control: ofrece herramientas para ajustar y controlar las características de los datos, asegurando que cumplan con las necesidades específicas de diferentes aplicaciones.

El uso de datos sintéticos ofrece muchas ventajas en términos de disponibilidad, privacidad y diversidad, pero también presenta desafíos en cuanto a realismo y validación. Con la evolución de tecnologías como el nuevo sistema de NVIDIA, los datos sintéticos pueden complementar efectivamente a los datos reales, mejorando la calidad y efectividad de las IAs. Un enfoque equilibrado y regulado será clave para aprovechar al máximo estos avances mientras se minimizan los riesgos.

Las cosas como son.

Mookie Tenembaum aborda temas internacionales como este todas las semanas junto a Horacio Cabak en su podcast El Observador Internacional, disponible en Spotify, Apple, YouTube y todas las plataformas.

Los datos "inventados" en la inteligencia artificial

Compartir en

Te puede interesar

Adaptarse o quedar atrás: el desafío de modernizar las reglas del mercado

Te puede interesar

El futuro del ecommerce: operaciones agénticas con inteligencia artificial

Archivado en

Genneia amplía su apuesta solar en Mendoza y refuerza el vínculo estratégico entre energía renovable y minería

Una megaciudad del cobre para 5.000 mineros fabricada en China: por qué Vicuña no eligió proveedores locales

La historia real detrás de El testigo, la serie que arrasa en Netflix

Los mejores estrenos para ver esta semana en streaming

Ni abdominales ni planchas: qué es el vacío abdominal para tener la panza chata

¡Postre de chocolate súper exprés! Tenelo listo en minutos y dejá a todos con la boca abierta

Estilo y Tendencias

Servicios

Compartir en

Te puede interesar

Adaptarse o quedar atrás: el desafío de modernizar las reglas del mercado

Te puede interesar

El futuro del ecommerce: operaciones agénticas con inteligencia artificial

Archivado en

La relación con los clientes ya no se gestiona, se orquesta

Innovar no alcanza: el desafío de darle un rumbo al progreso

ChatGPT actualiza su sistema y ahora recuerda tus datos entre distintas conversaciones

Genneia amplía su apuesta solar en Mendoza y refuerza el vínculo estratégico entre energía renovable y minería

Una megaciudad del cobre para 5.000 mineros fabricada en China: por qué Vicuña no eligió proveedores locales

La historia real detrás de El testigo, la serie que arrasa en Netflix

Los mejores estrenos para ver esta semana en streaming

Ni abdominales ni planchas: qué es el vacío abdominal para tener la panza chata

¡Postre de chocolate súper exprés! Tenelo listo en minutos y dejá a todos con la boca abierta

Estilo y Tendencias

Servicios