A medida que las empresas de servicios financieros se esfuerzan por seguir el ritmo de los avances tecnológicos como el aprendizaje automático y la inteligencia synthetic (IA), la gobernanza de datos (GD) y la gestión de datos (GD) desempeñan un papel cada vez más importante, un papel que a menudo se minimiza en lo que se ha convertido en una carrera armamentista tecnológica.
La DG y la DM son componentes fundamentales de una plataforma de análisis y datos empresariales exitosa. Deben encajar en la filosofía y la estructura de inversión de una organización. La incorporación de conocimientos, experiencia y especialización en el ámbito empresarial permite a la empresa incorporar la gestión de BD junto con los datos tradicionales de pequeña escala.
Sin duda, la implementación de tecnologías avanzadas generará mayores eficiencias y garantizará ventajas competitivas mediante una mayor productividad, ahorros de costos y estrategias y productos diferenciados. Pero, por más sofisticadas y costosas que sean las herramientas de inteligencia synthetic de una empresa, no debe olvidarse que el principio “basura que entra, basura que sale” (GIGO, por sus siglas en inglés) se aplica a todo el proceso de gestión de inversiones.
Los datos de entrada defectuosos y de mala calidad están destinados a producir resultados defectuosos e inútiles. Los modelos de IA deben entrenarse, validarse y probarse con datos de alta calidad extraídos y destinados para el entrenamiento, la validación y la prueba.
Obtener los datos correctos suele parecer poco interesante o incluso aburrido para la mayoría de los profesionales de la inversión. Además, los profesionales normalmente no piensan que su descripción de trabajo incluya la DG y la DM.
Sin embargo, entre los líderes de la industria existe un creciente reconocimiento de que los equipos multifuncionales en forma de T ayudarán a las organizaciones a desarrollar procesos de inversión que incorporen inteligencia synthetic y huge information (BD). Sin embargo, a pesar de la mayor colaboración entre las funciones de inversión y tecnología, los aportes críticos de DG y DM a menudo no son lo suficientemente sólidos.
Diagrama de Venn de la ciencia de datos
La BD es el insumo principal de los modelos de IA. La ciencia de datos es un campo interdisciplinario que comprende superposiciones entre matemáticas y estadísticas, informática, conocimiento del dominio y experiencia. Como escribí en una publicación de weblog anterior, los equipos humanos que se adapten con éxito al panorama cambiante perseverarán. Aquellos que no lo hagan probablemente se volverán obsoletos.
El gráfico 1 ilustra las funciones superpuestas. Si analizamos el diagrama de Venn desde la perspectiva de las funciones laborales dentro de una empresa de gestión de inversiones, los profesionales de la IA se ocupan de las matemáticas y las estadísticas; los profesionales de la tecnología se ocupan de la informática; y los profesionales de la inversión aportan una gran cantidad de conocimientos, experiencia y especialización al equipo, con la ayuda de los profesionales de los datos.
Exhibición 1.
La Tabla 1 se ocupa únicamente de las características de BD. Es evidente que no se puede esperar que los profesionales con habilidades en un área se ocupen de este nivel de complejidad.
Tabla 1. BD y Cinco Vs.
El volumen, la veracidad y el valor son un desafío debido a la persistente incertidumbre sobre la integridad y precisión de los datos, así como sobre la validez de la información obtenida.
Para aprovechar el potencial de la inteligencia empresarial y la inteligencia synthetic, los profesionales de la inversión deben comprender cómo funcionan estos conceptos en la práctica. Solo así podrán impulsar la eficiencia, la productividad y la ventaja competitiva.
Entran en escena los directores generales y los directores de departamento, que son fundamentales para gestionar la protección de datos y la privacidad segura de los mismos, que son áreas de gran interés regulatorio. Esto incluye la reforma regulatoria posterior a la disaster financiera mundial, como la norma 239 del Comité de Supervisión Bancaria de Basilea (BCBS239) y la Directiva Solvencia II de la Unión Europea. Entre las medidas regulatorias más recientes se incluyen el Cuadro de mando de calidad de datos del Banco Central Europeo, la Ley de Privacidad del Consumidor de California y el Reglamento Basic de Protección de Datos (GDPR) de la UE, que obliga al sector a gestionar mejor la privacidad de los datos personales de las personas.
Es possible que las futuras regulaciones otorguen a los individuos una mayor propiedad sobre sus datos. Las empresas deberían trabajar para definir los derechos y estándares de los datos digitales, en specific en lo que respecta a cómo protegerán la privacidad particular person.
Los datos incorporan tanto las entradas sin procesar como el “contenido” resultante. El contenido es el resultado del análisis, a menudo en paneles que permiten contar historias. Los modelos de GD se pueden construir sobre esta base y las prácticas de GD no necesariamente serán las mismas en todas las organizaciones. Cabe destacar que los marcos de GD aún no han abordado cómo manejar los modelos de BD e IA, que existen solo efímeramente y cambian con frecuencia.
¿Cuáles son los componentes clave de la gobernanza de datos?
Alineación y compromiso: la alineación con la estrategia de datos en toda la empresa y el compromiso de la gerencia con ella son fundamentales. Es deseable contar con la orientación de un comité de múltiples partes interesadas dentro de una organización. Desde una perspectiva de management interno y gobernanza, se debe garantizar un nivel mínimo de transparencia, explicabilidad, interpretabilidad, auditabilidad, trazabilidad y repetibilidad para que un comité pueda analizar los datos, así como los modelos utilizados, y aprobar la implementación. Esta función debe estar separada del proceso de investigación de datos y desarrollo de modelos bien documentado.
Seguridad: La seguridad de los datos es la práctica de definir, etiquetar y aprobar los datos según sus niveles de riesgo y recompensa, y luego otorgar derechos de acceso seguro a las partes interesadas correspondientes. En otras palabras, implementar medidas de seguridad y proteger los datos contra el acceso no autorizado y la corrupción de datos. Mantener un equilibrio entre la accesibilidad del usuario y la seguridad es basic.
Transparencia: todas las políticas y procedimientos que adopte una empresa deben ser transparentes y auditables. La transparencia implica permitir que los analistas de datos, los administradores de cartera y otras partes interesadas comprendan la fuente de los datos y cómo se procesan, almacenan, consumen, archivan y eliminan.
Cumplimiento: no basta con garantizar que existan controles para cumplir con las políticas y procedimientos corporativos, así como con los requisitos normativos y legislativos. Es necesario un seguimiento constante. Las políticas deben incluir la identificación de los atributos de la información confidencial, la protección de la privacidad mediante la anonimización y la tokenización de los datos cuando sea posible, y el cumplimiento de los requisitos de retención de información.
Administración: se debe establecer un equipo asignado de administradores de datos para supervisar y controlar cómo los usuarios comerciales acceden a los datos. Estos administradores darán ejemplo y garantizarán la calidad, la seguridad, la transparencia y el cumplimiento de los datos.
¿Cuáles son los elementos clave de la gestión de datos?
Preparación: es el proceso de limpieza y transformación de datos sin procesar para garantizar su integridad y precisión. Este primer paso basic a veces se pasa por alto en la prisa por realizar análisis y generar informes, y las organizaciones terminan tomando decisiones erróneas con datos erróneos.
Crear un modelo de datos que esté “diseñado para evolucionar constantemente” es mucho mejor que crear un modelo de datos que esté “diseñado para durar tanto como está”. El modelo de datos debe satisfacer las necesidades actuales y adaptarse a los cambios futuros.
Las bases de datos recopiladas en condiciones heterogéneas (es decir, diferentes poblaciones, regímenes o métodos de muestreo) brindan nuevas oportunidades de análisis que no se pueden lograr mediante fuentes de datos individuales. Al mismo tiempo, la combinación de esos entornos heterogéneos subyacentes da lugar a posibles desafíos y dificultades analíticas, como la selección de muestras, los factores de confusión y los sesgos entre poblaciones, mientras que la estandarización y la agregación de datos hacen que el manejo y el análisis de datos sean sencillos, pero no necesariamente reveladores.
Catálogos, almacenes y canalizaciones: los catálogos de datos albergan los metadatos y ofrecen una vista integral de los datos, lo que facilita su búsqueda y seguimiento. Los almacenes de datos consolidan todos los datos en los catálogos y las canalizaciones de datos transfieren automáticamente los datos de un sistema a otro.
Extraer, transformar y cargar (ETL): ETL significa transformar datos a un formato que se pueda cargar en el almacén de datos de una organización. Los ETL suelen ser procesos automatizados que están precedidos por la preparación y el procesamiento de datos.
Arquitectura de datos: es la estructura formal para gestionar el flujo y el almacenamiento de datos.
DM sigue las políticas y los procedimientos definidos en DG. El marco DM gestiona el ciclo de vida completo de los datos para satisfacer las necesidades de la organización en cuanto a utilización de datos, toma de decisiones y acciones concretas.
Disponer de estos marcos de DG y DM es basic para analizar el negocio complejo. Si los datos deben tratarse como un activo importante de la empresa, la organización debe estructurarse y gestionarse como tal.
Además, es basic entender que la DG y la DM deben trabajar en sincronía. La DG sin DM y su implementación termina siendo una quimera. La DG establece todas las políticas y procedimientos, y la DM y su implementación permiten a una organización analizar datos y tomar decisiones.
Para utilizar una analogía, la DG crea y diseña un plano para la construcción de un nuevo edificio, y la DM es el acto de construir el edificio. Aunque se puede construir un edificio pequeño (DM en esta analogía) sin un plano (DG), será menos eficiente, menos eficaz, no cumplirá con las regulaciones y tendrá una mayor probabilidad de que el edificio se derrumbe cuando se produzca un terremoto potente.
Comprender tanto la DG como la DM ayudará a su organización a aprovechar al máximo los datos disponibles y tomar mejores decisiones comerciales.
Referencias
Larry Cao, CFA, CFA Institute (2019), Pioneros de la IA en la gestión de inversiones, https://www.cfainstitute.org/en/analysis/industry-research/ai-pioneers-in-investment-management
Larry Cao, CFA, CFA Institute (2021), Equipos en forma de T: organización para adoptar IA y huge information en empresas de inversión, https://www.cfainstitute.org/en/analysis/industry-research/t-formed-teams
Yoshimasa Satoh, CFA, (2022), Algoritmos de aprendizaje automático y métodos de entrenamiento: un diagrama de flujo para la toma de decisiones, https://blogs.cfainstitute.org/investor/2022/08/18/machine-learning-algorithms-and-training-methods-a-decision-making-flowchart/
Yoshimasa Satoh, CFA y Michinori Kanokogi, CFA (2023), ChatGPT e IA generativa: qué significan para los profesionales de la inversión, https://blogs.cfainstitute.org/investor/2023/05/09/chatgpt-and-generative-ai-what-they-mean-for-investment-professionals/
Tableau, Gestión de datos frente a gobernanza de datos: explicación de la diferencia, https://www.tableau.com/study/articles/data-management-vs-data-governance
KPMG (2021), ¿Qué es la gobernanza de datos y qué papel debe desempeñar el área financiera? https://advisory.kpmg.us/articles/2021/finance-data-analytics-common-questions/data-governance-finance-play-role.html
Deloitte (2021), Establecer una estrategia de datos financieros “construida para evolucionar”: modelos sólidos de gobernanza de datos e información empresarial, https://www2.deloitte.com/us/en/pages/operations/articles/data-governance-model-and-finance-data-strategy.html
Deloitte (2021), Definición de la estrategia de datos financieros, el modelo de información empresarial y el modelo de gobernanza, https://www2.deloitte.com/content material/dam/Deloitte/us/Paperwork/process-and-operations/us-defining-the-finance-data-strategy.pdf
Ernst & Younger (2020), Tres prioridades para que las instituciones financieras impulsen un marco de gobernanza de datos de próxima generación, https://belongings.ey.com/content material/dam/ey-sites/ey-com/en_gl/subjects/banking-and-capital-markets/ey-three-priorities-for-fis-to-drive-a-next-generation-data-governance-framework.pdf
OCDE (2021), Inteligencia synthetic, aprendizaje automático y huge information en finanzas: oportunidades, desafíos e implicaciones para los responsables políticos, https://www.oecd.org/finance/artificial-intelligence-machine-learning-big-data-in-finance.htm.