Meta presenta su nuevo superordenador para inteligencia artificial

Cuando finalice su construcción, la red InfiniBand conectará 16 mil GPU como 'endpoints'
Foto: META

Meta presentó este lunes AI Research SuperCluster (RSC), un superordenador para la investigación con inteligencia artificial (IA) con el que cimentará el camino hacia el metaverso, y que espera que se convierta en el más rápido del mundo de su tipo cuando esté finalizado.    

AI Research SuperCluster nace para dar respuesta a las necesidades que demanda el desarrollo de la siguiente generación de IA avanzada, que, como señala Meta en un comunicado, "requiere ordenadores capaces de hacer trillones de operaciones por segundo".    

Este equipo es el que ayudará a la compañía a dar forma al metaverso. Por el momento, los investigadores de Meta lo han empleado en el entrenamiento de modelos de gran tamaño para el procesamiento de lenguaje natural y la búsqueda mediante visión computacional, pero esperan que pueda, por ejemplo, impulsar las traducciones en tiempo real en grandes grupos de personas que hablan distintos idiomas.

El nuevo superordenador ya se encuentra entre los más rápidos actualmente existentes y Meta espera que sea "el superordenador para IA más rápido" cuando se complete su construcción a mediados del presente año.  

 

Nueva infraestructura computacional

RSC es heredero de los trabajos hechos por la compañía en infraestructura computacional de alto rendimiento, cuya primera generación se diseñó en 2017. Esta contaba con 22 mil unidades de procesamiento gráfico (GPU) V100 Tensor Core de Nvidia en un solo clúster, y ejecutaba 35 mil tareas de entrenamiento al día. 

Tres años más tarde, la empresa decidió desarrollar una nueva infraestructura que fuera capaz de entrenar los modelos con más de un billón de parámetros en bases de datos tan grandes como un exabyte (más de 36 mil años de vídeo en alta calidad).    

Frente a la anterior, que empleaba conjuntos de datos de código abierto y disponibles de forma pública, la nueva también incorpora ejemplos del mundo real de los sistemas de producción de Meta en el entrenamiento de modelos, como señaló la compañía.    

RSC cuenta con 760 sistemas DGX A100 de Nvidia como sus nodos de cómputo, para un total de 6 mil 80 GPU. Estas unidades de procesamiento gráfico se comunican a través del conmutador Quantum InfiniBand 200 Gb/s de Nvidia.    

En cuanto al almacenamiento, el superordenador tiene 175 petabytes de Pure FlashArray, 46 petabytes de almacenamiento en caché en los sistemas Penguin Computing Altus y 10 petabytes de Pure FlashBlade.    

Este superordenador para IA no está terminado, pero las primeras pruebas de benchmark muestran que es 20 veces más rápido en cargas de trabajo de visión computacional que la infraestructura anterior. 

También ejecuta la biblioteca de comunicación colectiva (NCCL) de Nvidia nueve veces más rápido y entrena a gran escala modelos de procesamiento de lenguaje natural tres veces más rápido.    

La compañía también destacó que la seguridad y la privacidad están en el centro de este superordenador, lo que permite que los investigadores puedan entrenar sus modelos utilizando datos encriptados generados por el usuario "que no se desencriptan hasta justo antes de empezar el entrenamiento".    

RSC, además, carece de conexiones entrantes o salientes directas con Internet y el tráfico fluye solo desde los centros de datos de producción Meta, y cuenta con encriptación de extremo a extremo entre los sistemas de almacenamiento y las GPU.

 

‘’El más rápido del mundo''

Cuando se complete su construcción, la red InfiniBand conectará 16 mil GPU como 'endpoints', con lo que multiplicará por más 2,5 el rendimiento en el entrenamiento de IA, convirtiéndolo, además, y según ha destacado Meta, en "una de las redes de este tipo más grandes desplegadas hasta la fecha".   

También escalarán el sistema de almacenamiento, que actualmente sirve un ancho de banda de 16TB/s para el entrenamiento de datos, hasta un exabyte. En conjunto, la compañía defiende que será el "superordenador para IA más rápido del mundo" con un rendimiento de cerca de cinco exaflops de computación de precisión mixta.

 

También te puede interesar: Tik Tok ofrecerá suscripciones de pago

 

Edición: Estefanía Cardeña


Lo más reciente

Kanasín debuta como sede de la LMB con buen beisbol y emociones

La apertura de Valdez y el despertar del Mago Fuentes, entre lo mejor

Antonio Bargas Cicero

Kanasín debuta como sede de la LMB con buen beisbol y emociones

Detiene FGE Quintana Roo a una persona que roció gasolina a una mujer

La víctima también fue amagada por un arma punzo cortante en su domicilio

La Jornada Maya

Detiene FGE Quintana Roo a una persona que roció gasolina a una mujer

Al menos 10 muertos en incendio de albergue de personas sin hogar en Porto Alegre, Brasil

Nueve personas resutaron heridas, cuatro de ellas ''en estado grave''

Afp

Al menos 10 muertos en incendio de albergue de personas sin hogar en Porto Alegre, Brasil

China y EU deben ser ''socios, no rivales'', le dice Xi Jinping a Blinken

Las dos potencias económicas advirtieron de que quedan ''muchos problemas'' por resolver en sus relaciones bilaterales

Afp

China y EU deben ser ''socios, no rivales'', le dice Xi Jinping a Blinken