Vea También
Meta ha presentado el AI Research SuperCluster (RSC), un nuevo superordenador que se encuentra entre los más rápidos del mundo. Y cada vez será más rápido: a finales de año debería ocupar el primer puesto, con una potencia de cálculo a exaescala. Crédito de la imagen: ArtStation |
Meta, el gigante tecnológico antes conocido como Facebook, ha diseñado y construido el AI Research SuperCluster (RSC), un nuevo superordenador que se encuentra entre los superordenadores de IA más rápidos de la actualidad. Se cree que el AI Research SuperCluster será el superordenador de IA más rápido del mundo cuando esté completamente construido a mediados de 2022.
Meta pretende utilizarlo para entrenar modelos de IA con más de un billón de parámetros que podrían hacer avanzar campos como el procesamiento del lenguaje natural para trabajos como la identificación de contenidos nocivos en tiempo real.
El nuevo superordenador de IA cuenta actualmente con un total de 760 sistemas NVIDIA DGX A100 como nodos de cálculo, lo que supone un total de 6.080 GPU NVIDIA A100, conectadas a través de una red Quantum InfiniBand que puede transmitir datos a 200 Gigabits por segundo. El nivel de almacenamiento de RSC cuenta con 175 petabytes de Pure Storage FlashArray, 46 petabytes de almacenamiento en caché en sistemas Penguin Computing Altus y 10 petabytes de Pure Storage FlashBlade.
Las primeras pruebas de Meta han demostrado que RSC ejecuta flujos de trabajo de visión por ordenador hasta 20 veces más rápido, ejecuta la biblioteca de comunicación colectiva de NVIDIA (NCCL) más de nueve veces más rápido y entrena modelos de PNL a gran escala tres veces más rápido que el sistema anterior.
Esquema del sistema de IA RSC de Meta. Fuente: Meta |
El AI Research SuperCluster (RSC), un nuevo superordenador, es uno de los más rápidos en la actualidad. Crédito: Meta AI |
Meta afirma que RSC cuenta con todos los controles de seguridad y privacidad necesarios para proteger los datos de entrenamiento que utiliza. Los investigadores de Meta pueden entrenar modelos de forma segura utilizando datos encriptados generados por los usuarios, que no se descifran hasta justo antes del entrenamiento.
En una segunda fase, a finales de este año, el RSC se ampliará a 16.000 GPU que, según Meta, proporcionarán la friolera de 5 exaflops de rendimiento de IA de precisión mixta. El tejido InfiniBand se ampliará para admitir 16.000 puertos en una topología de dos capas sin sobresuscripción. El sistema de almacenamiento tendrá un ancho de banda objetivo de 16 terabytes por segundo y una capacidad a escala de exabytes para satisfacer la creciente demanda.
Fuentes, créditos y referencias:
Fuente: Meta AI