Lo siguiente es una publicación invitada de Jiahao Solar, CEO y Fundador de FLock.io.
En el panorama en constante evolución de la inteligencia synthetic (IA), el debate entre la computación centralizada y la descentralizada se está intensificando. Los proveedores centralizados como Amazon Internet Providers (AWS) han dominado el mercado, ofreciendo soluciones sólidas y escalables para el entrenamiento y la implementación de modelos de IA. Sin embargo, la computación descentralizada está surgiendo como un competidor formidable, que presenta ventajas y desafíos únicos que podrían redefinir la forma en que se entrenan e implementan los modelos de IA a nivel mundial.
Eficiencia de costos mediante recursos no utilizados
Una de las principales ventajas de la computación descentralizada en IA es la rentabilidad. Los proveedores centralizados invierten mucho en infraestructura y mantienen grandes centros de datos con GPU dedicadas a los cálculos de IA. Este modelo, si bien es potente, es caro. La computación descentralizada, por otro lado, aprovecha las GPU “no utilizadas” de varias fuentes en todo el mundo.
Estos pueden ser computadoras personales, servidores inactivos o incluso consolas de juegos. Al aprovechar este conjunto de recursos subutilizados, las plataformas descentralizadas pueden ofrecer potencia informática a una fracción del costo de los proveedores centralizados. Esta democratización de los recursos informáticos hace que el desarrollo de la IA sea más accesible para las empresas más pequeñas y las empresas emergentes, lo que fomenta la innovación y la competencia en el espacio de la IA.
Accesibilidad mejorada de las GPU
La escasez mundial de GPU ha afectado significativamente la capacidad de las pequeñas empresas para obtener la potencia computacional necesaria de proveedores centralizados. Las grandes corporaciones suelen suscribir contratos a largo plazo y monopolizar el acceso a estos recursos críticos.
Las redes informáticas descentralizadas alivian este problema al obtener GPU de una amplia gama de contribuyentes, incluidos jugadores de PC individuales y proveedores a pequeña escala. Esta mayor accesibilidad garantiza que incluso las entidades más pequeñas puedan obtener la potencia computacional que necesitan sin verse eclipsadas por los gigantes de la industria.
Privacidad de datos y management de usuarios
La privacidad de los datos sigue siendo una preocupación primordial en el desarrollo de la IA. Los sistemas centralizados requieren que los datos se transfieran y almacenen en sus infraestructuras, lo que en la práctica implica renunciar al management del usuario. Esta centralización plantea importantes riesgos para la privacidad. La informática descentralizada ofrece una alternativa convincente al mantener los cálculos cerca del usuario. Esto se puede lograr mediante el aprendizaje federado, donde los datos permanecen en el dispositivo del usuario, o utilizando proveedores de computación descentralizados seguros.
El Personal Cloud Compute de Apple ejemplifica este enfoque al integrar varios nodos de computación de iCloud en torno a un usuario específico, manteniendo así la privacidad de los datos y aprovechando al mismo tiempo la potencia computacional de la nube. Si bien este método aún implica un cierto grado de centralización, subraya un cambio hacia un mayor management del usuario sobre los datos.
Protocolos de verificación y seguridad
A pesar de sus ventajas, la computación descentralizada enfrenta varios desafíos. Un problema crítico es verificar la integridad y seguridad de los nodos de computación descentralizados. Garantizar que estos nodos no se vean comprometidos y que proporcionen una potencia computacional genuina es un problema complejo.
Los avances en la tecnología blockchain ofrecen soluciones potenciales, permitiendo mecanismos de autoprotección que verifican la legitimidad de los nodos de cómputo sin comprometer la seguridad.
Preservación de la privacidad de los datos en sistemas descentralizados
Otro desafío importante es la posible exposición de datos personales durante los cálculos descentralizados. Los modelos de IA prosperan con grandes conjuntos de datos, pero sin tecnologías que preserven la privacidad, el entrenamiento descentralizado podría generar riesgos de vulneración de datos. Técnicas como el aprendizaje federado, las pruebas de conocimiento cero y el cifrado totalmente homomórfico pueden mitigar estos riesgos.
El aprendizaje federado, ampliamente adoptado por las principales corporaciones desde 2017, permite que los datos permanezcan locales y, al mismo tiempo, contribuyan al entrenamiento de modelos. Al integrar estas tecnologías de cifrado y preservación de la privacidad en redes informáticas descentralizadas, podemos mejorar la seguridad de los datos y la privacidad del usuario, ampliando los límites de lo que puede lograr la IA descentralizada.
Preocupaciones sobre el ancho de banda y la eficiencia
La eficiencia de las redes informáticas descentralizadas es otro tema de preocupación. La eficiencia de transmisión en un sistema descentralizado inevitablemente quedará rezagada con respecto a los clústeres centralizados debido a la naturaleza distribuida de la crimson. Las anécdotas históricas, como la transferencia de datos de AWS desde Toronto a Vancouver durante una tormenta de nieve, ponen de relieve los desafíos logísticos de la transmisión de datos.
Sin embargo, los avances en técnicas de IA como el ajuste fino de LoRA y la compresión de modelos pueden ayudar a mitigar estos cuellos de botella en el ancho de banda. Al optimizar los procesos de transferencia de datos y refinar las técnicas de entrenamiento de modelos, las redes informáticas descentralizadas pueden alcanzar niveles de rendimiento que sean competitivos con sus contrapartes centralizadas.
Cerrando la brecha con las tecnologías emergentes
La integración de la tecnología blockchain con la IA ofrece una vía prometedora para abordar muchos de los desafíos que enfrenta la computación descentralizada. La tecnología blockchain proporciona un registro transparente e inmutable para rastrear la procedencia de los datos y la integridad de los nodos de cómputo. Esto garantiza que todos los participantes de la crimson puedan confiar en los datos y los cálculos que se realizan.
Además, los mecanismos de consenso de blockchain pueden facilitar la gobernanza descentralizada, permitiendo a las comunidades gestionar y mejorar la crimson colectivamente.
Además, los avances en el aprendizaje federado y el cifrado homomórfico son fundamentales para garantizar que se mantenga la privacidad de los datos y, al mismo tiempo, aprovechar la naturaleza distribuida de las redes informáticas descentralizadas. Estas tecnologías permiten que los modelos de IA aprendan de conjuntos de datos distribuidos sin exponer información confidencial, lo que equilibra la necesidad de grandes cantidades de datos con estrictos requisitos de privacidad.
El futuro de la computación descentralizada en la IA
El potencial de las redes informáticas descentralizadas para revolucionar el desarrollo de la IA es inmenso. Al democratizar el acceso a los recursos informáticos, mejorar la privacidad de los datos y aprovechar las tecnologías emergentes, la IA descentralizada puede ofrecer una alternativa sólida a los sistemas centralizados. Sin embargo, el camino está plagado de desafíos que requieren soluciones innovadoras y esfuerzos colaborativos de las comunidades de IA y blockchain.
A medida que avanzamos, debemos seguir explorando y desarrollando soluciones informáticas descentralizadas que aborden estos desafíos. Al fomentar un ecosistema colaborativo, podemos garantizar que los beneficios de la IA sean accesibles para todos, promoviendo un futuro más equitativo e innovador para el desarrollo de la IA.