El Valor de los Datos Sintéticos en Servicios Financieros

Las empresas apenas han comenzado a reconocer la importancia y el potencial de la Inteligencia Artificial, y por lo tanto la aplicación de datos sintéticos en sus pipelines de datos para asegurar la privacidad de datos sensibles para construir modelos de aprendizaje automático seguros y precisos.

Uno de los sectores donde la "anonimización de datos" es crucial es el sector financiero, en el cual la transformación digital se está volviendo cada vez más importante para el futuro de la industria (1). La capacidad de mezclar datos personales e información bancaria respetando el GDPR plantea un enorme desafío para extraer datos con valor real. Además, como discutimos en nuestro blog anterior, Por qué los Métodos Tradicionales de Anonimización de Datos ya no Funcionan, las técnicas de anonimización convencionales no aseguran ni la privacidad ni la utilidad de los datos.

A pesar de estos desafíos, las empresas financieras basadas en datos tienen un potencial "comodín" que marca la diferencia entre obtener conocimiento real y tener problemas con el procesamiento de datos: datos sintéticos.

Datos e IA en el sector bancario

En el sector de servicios financieros específicamente, el uso de datos trae enormes beneficios, permitiendo a las instituciones financieras y empresas Fintech ofrecer mayor valor y servicios personalizados a los clientes y abordar desafíos de negocio como una detección de fraude más fuerte o reducción de costos. Los datos financieros se crean con cada transacción y acción tomada por las instituciones financieras mientras interactúan con los clientes.

La presencia de nuevas técnicas para extraer valor de los datos como el aprendizaje automático o el aprendizaje profundo está aumentando progresivamente en los servicios financieros, especialmente en banca minorista o soluciones Fintech. Las innovaciones tecnológicas han mejorado la capacidad de las empresas para capturar y usar datos de clientes. La computación avanzada aumenta la capacidad de almacenar, gestionar y transferir datos, mientras que la analítica avanzada permite mayor insight sobre comportamientos y preferencias de los clientes.

Por otro lado, estas tendencias también vienen con ciertos desafíos, limitaciones y obligaciones con respecto al acceso y tratamiento de datos personales de clientes. Los clientes no siempre están dispuestos a compartir cierta información personal debido a preocupaciones de privacidad. De hecho, el 80% de los consumidores dicen que son aún más protectores de sus datos financieros que de otra información personal. Además, es común almacenar datos "sucios" o incompletos que son inútiles para el desarrollo de nuevos productos o modelos. En la mayoría de los casos, los conjuntos de datos no son representativos y vienen con sesgos, dificultando obtener productos de aprendizaje automático confiables.

Con tales cantidades masivas de datos y sistemas usándolos, ahora es más importante que nunca proteger la información de amenazas internas y externas. Las multas por violar regulaciones de protección de datos rompieron un récord en 2021, excediendo los mil millones de dólares a nivel mundial, representando un aumento de más del 500% comparado con 2020.

Beneficios de los datos sintéticos en servicios financieros

Los datos sintéticos son datos generados artificialmente a partir de los datos originales pero que mantienen las mismas características estadísticas, informativas y predictivas. Mientras que los datos reales se recopilan en cada una de las interacciones físicas o digitales con personas y a través de procesos internos, los datos sintéticos se generan con un algoritmo. Este algoritmo o modelo sintético es capaz de generar conjuntos de datos completamente nuevos y artificiales. En la creación de datos sintéticos, está implícito un proceso real de anonimización, es decir, los datos sintéticos son datos 100% anónimos, ya que su re-identificación es imposible, a diferencia de otras técnicas.

Las entidades financieras tendrán que ir más allá de los requisitos regulatorios y la aplicación de mejores prácticas en términos de protección de datos si realmente quieren aprovechar al máximo sus datos. Los datos sintéticos juegan un papel fundamental en el desarrollo y entrenamiento de modelos de Inteligencia Artificial, y su uso aumentará a medida que la industria financiera se mueva de "Big Data" a "Smart Data".

Los datos sintéticos para creación y optimización de modelos están emergiendo como uno de los principales casos de uso de IA para instituciones financieras, representando más del 11% de la inversión total en IA, según el informe de NVIDIA sobre el Estado de la IA en Servicios Financieros. Esto demuestra la rápida adopción de IA en los servicios financieros, lo cual está requiriendo que los bancos inviertan en IA empresarial que asegure la privacidad de los clientes y promueva la innovación de datos de manera más rentable y segura.

Junto con la precisión del modelo y la privacidad de datos, los datos sintéticos traen una serie de otros beneficios como:

Soluciones de datos con menos sesgo

Generalmente, la distribución de un conjunto de datos lleva un sesgo que implica un impacto negativo en la eficiencia del modelo y su aplicación futura. En estas situaciones, los datos sintéticos pueden complementar el conjunto de datos original para equilibrar la representatividad con datos de calidad al entrenar un modelo. Esto puede ayudar a la Inteligencia Artificial a reducir el sesgo, estando siempre al servicio del cliente.

Democratización de datos

Proporcionar a los equipos técnicos y de negocio acceso rápido a conjuntos de datos accionables es crucial para fomentar una cultura de datos saludable. El uso de datos sintéticos para el desarrollo de software y soluciones basadas en modelos estadísticos permite una colaboración más eficiente entre diferentes equipos. Además, los datos sintéticos simplifican la estrategia de gobernanza de datos interna y reducen la fricción entre departamentos, agilizando así los procesos.

Mejores productos y servicios centrados en el cliente

Los datos sintéticos pueden usarse para desarrollar nuevas características, servicios y productos, y posteriormente probar cómo reaccionarán ciertos tipos de usuarios ante ellos. Por ejemplo, para probar un sistema de interacción con el usuario a través de notificaciones (recibir una notificación cuando se acredita tu salario en tu cuenta), simplemente crea un conjunto de usuarios con un gran número de transacciones pasadas y futuras, y así simular un usuario en tiempo real que cumpla con ese comportamiento específico.

Acelerando la innovación en torno a los datos

El uso de Inteligencia Artificial tiene que ser una de las prioridades de las instituciones financieras. Si estas instituciones no priorizan estos métodos, estarán en riesgo de ser reemplazadas por otros competidores que realmente los están utilizando. La innovación en torno a los datos será mucho más rápida si el acceso a los datos es ágil y dinámico, y tan efectivo como la calidad de los datos.

Garantizar la privacidad de los clientes

Los datos sintéticos permiten a las instituciones financieras crear aplicaciones y soluciones de software sin exponer información personal identificable (PII) y/o información de salud (PHII) de sus clientes. Al mismo tiempo, se reduce el riesgo para los socios que colaboran con instituciones financieras en el desarrollo de tecnología, promoviendo la innovación y poniendo en producción iniciativas de Inteligencia Artificial disruptivas, optimizando el tiempo-de-mercado.

Reducción de riesgos

Alrededor del 60% de los problemas relacionados con la privacidad son causados por los propios empleados de la organización. Este problema aumenta cuando estas organizaciones tienen acceso a más datos. Proporcionar alternativas basadas en datos sintéticos a los diferentes equipos dentro de la organización, incluso en la Nube, es una estrategia primaria para minimizar la exposición de datos personales, y así evitar sanciones y fugas de datos.

Conclusión

El uso de datos sintéticos en servicios financieros se está convirtiendo en un requisito obligatorio para las instituciones financieras debido a la cantidad de problemas relacionados con la privacidad y la calidad de los datos que esta tecnología resuelve fácilmente.

Los beneficios de usar datos sintéticos son muy diversos, desde resolver sesgos en los datos hasta aumentar el conocimiento del cliente a través de mejores segmentaciones, y así obtener mejores dinámicas de negocio y oportunidades de mercado.

Aparte de los beneficios, los datos sintéticos abren una nueva gama de casos de uso para bancos e instituciones financieras, ya que podrían aprovechar sus activos de datos para fomentar la innovación mientras mantienen la privacidad de sus clientes.

¿Quieres saber más sobre los usos de los datos sintéticos en banca y sus aplicaciones? No te pierdas el próximo artículo sobre Casos de uso de datos sintéticos en banca.