NVIDIA ha presentado un avance significativo en la privacidad de datos para el aprendizaje federado al integrar el cifrado homomórfico acelerado por CUDA en Federated XGBoost. Según NVIDIA, este desarrollo tiene como objetivo abordar los problemas de seguridad en las colaboraciones de aprendizaje federado tanto horizontales como verticales.
XGBoost federado y sus aplicaciones
NVIDIA ha ampliado XGBoost, un algoritmo de aprendizaje automático ampliamente utilizado para el modelado de datos tabulares, para admitir la capacitación colaborativa en múltiples sitios a través de Federated XGBoost. Este complemento permite que el modelo funcione en fuentes de datos descentralizadas en configuraciones tanto horizontales como verticales. En el aprendizaje federado vertical, las partes tienen diferentes características de un conjunto de datos, mientras que en entornos horizontales, cada parte tiene todas las características de un subconjunto de la población.
NVIDIA FLARE, un SDK de código abierto, respalda este marco de aprendizaje federado al gestionar los desafíos de comunicación y garantizar un funcionamiento perfecto en diversas condiciones de pink. Federated XGBoost opera bajo el supuesto de plena confianza mutua, pero NVIDIA reconoce que, en la práctica, los participantes pueden intentar obtener información adicional de los datos, lo que requiere medidas de seguridad mejoradas.
Mejoras de seguridad con cifrado homomórfico
Para mitigar posibles fugas de datos, NVIDIA ha integrado el cifrado homomórfico (HE) en Federated XGBoost. Este cifrado garantiza que los datos permanezcan seguros durante el cálculo, abordando el modelo de amenaza “honesto pero curioso” en el que los participantes pueden intentar inferir información confidencial. La integración incluye complementos HE basados en CPU y acelerados por CUDA, y estos últimos ofrecen importantes ventajas de velocidad sobre las soluciones tradicionales.
En el aprendizaje federado vertical, la parte activa cifra los gradientes antes de compartirlos con las partes pasivas, lo que garantiza que la información confidencial de la etiqueta esté protegida. En el aprendizaje horizontal, los histogramas locales se cifran antes de la agregación, lo que impide que el servidor u otros clientes accedan a los datos sin procesar.
Ganancias de eficiencia y rendimiento
HE acelerado por CUDA de NVIDIA ofrece mejoras de velocidad de hasta 30 veces para XGBoost vertical en comparación con las soluciones de terceros existentes. Este aumento del rendimiento es essential para aplicaciones con altas necesidades de seguridad de datos, como la detección de fraude financiero.
Las pruebas comparativas realizadas por NVIDIA demuestran la solidez y eficiencia de su solución en varios conjuntos de datos, destacando mejoras sustanciales en el rendimiento. Estos resultados subrayan el potencial del cifrado acelerado por GPU para transformar los estándares de privacidad de datos en el aprendizaje federado.
Conclusión
La integración del cifrado homomórfico en Federated XGBoost marca un importante paso adelante en el aprendizaje federado seguro. Al proporcionar una solución sólida y eficiente, NVIDIA aborda el doble desafío de la privacidad de los datos y la eficiencia computacional, allanando el camino para una adopción más amplia en industrias que requieren una protección de datos estricta.
Fuente de la imagen: Shutterstock