Meta presenta su nuevo superordenador para inteligencia artificial

Cuando finalice su construcción, la red InfiniBand conectará 16 mil GPU como 'endpoints'
Foto: META

Meta presentó este lunes AI Research SuperCluster (RSC), un superordenador para la investigación con inteligencia artificial (IA) con el que cimentará el camino hacia el metaverso, y que espera que se convierta en el más rápido del mundo de su tipo cuando esté finalizado.    

AI Research SuperCluster nace para dar respuesta a las necesidades que demanda el desarrollo de la siguiente generación de IA avanzada, que, como señala Meta en un comunicado, "requiere ordenadores capaces de hacer trillones de operaciones por segundo".    

Este equipo es el que ayudará a la compañía a dar forma al metaverso. Por el momento, los investigadores de Meta lo han empleado en el entrenamiento de modelos de gran tamaño para el procesamiento de lenguaje natural y la búsqueda mediante visión computacional, pero esperan que pueda, por ejemplo, impulsar las traducciones en tiempo real en grandes grupos de personas que hablan distintos idiomas.

El nuevo superordenador ya se encuentra entre los más rápidos actualmente existentes y Meta espera que sea "el superordenador para IA más rápido" cuando se complete su construcción a mediados del presente año.  

 

Nueva infraestructura computacional

RSC es heredero de los trabajos hechos por la compañía en infraestructura computacional de alto rendimiento, cuya primera generación se diseñó en 2017. Esta contaba con 22 mil unidades de procesamiento gráfico (GPU) V100 Tensor Core de Nvidia en un solo clúster, y ejecutaba 35 mil tareas de entrenamiento al día. 

Tres años más tarde, la empresa decidió desarrollar una nueva infraestructura que fuera capaz de entrenar los modelos con más de un billón de parámetros en bases de datos tan grandes como un exabyte (más de 36 mil años de vídeo en alta calidad).    

Frente a la anterior, que empleaba conjuntos de datos de código abierto y disponibles de forma pública, la nueva también incorpora ejemplos del mundo real de los sistemas de producción de Meta en el entrenamiento de modelos, como señaló la compañía.    

RSC cuenta con 760 sistemas DGX A100 de Nvidia como sus nodos de cómputo, para un total de 6 mil 80 GPU. Estas unidades de procesamiento gráfico se comunican a través del conmutador Quantum InfiniBand 200 Gb/s de Nvidia.    

En cuanto al almacenamiento, el superordenador tiene 175 petabytes de Pure FlashArray, 46 petabytes de almacenamiento en caché en los sistemas Penguin Computing Altus y 10 petabytes de Pure FlashBlade.    

Este superordenador para IA no está terminado, pero las primeras pruebas de benchmark muestran que es 20 veces más rápido en cargas de trabajo de visión computacional que la infraestructura anterior. 

También ejecuta la biblioteca de comunicación colectiva (NCCL) de Nvidia nueve veces más rápido y entrena a gran escala modelos de procesamiento de lenguaje natural tres veces más rápido.    

La compañía también destacó que la seguridad y la privacidad están en el centro de este superordenador, lo que permite que los investigadores puedan entrenar sus modelos utilizando datos encriptados generados por el usuario "que no se desencriptan hasta justo antes de empezar el entrenamiento".    

RSC, además, carece de conexiones entrantes o salientes directas con Internet y el tráfico fluye solo desde los centros de datos de producción Meta, y cuenta con encriptación de extremo a extremo entre los sistemas de almacenamiento y las GPU.

 

‘’El más rápido del mundo''

Cuando se complete su construcción, la red InfiniBand conectará 16 mil GPU como 'endpoints', con lo que multiplicará por más 2,5 el rendimiento en el entrenamiento de IA, convirtiéndolo, además, y según ha destacado Meta, en "una de las redes de este tipo más grandes desplegadas hasta la fecha".   

También escalarán el sistema de almacenamiento, que actualmente sirve un ancho de banda de 16TB/s para el entrenamiento de datos, hasta un exabyte. En conjunto, la compañía defiende que será el "superordenador para IA más rápido del mundo" con un rendimiento de cerca de cinco exaflops de computación de precisión mixta.

 

También te puede interesar: Tik Tok ofrecerá suscripciones de pago

 

Edición: Estefanía Cardeña


Lo más reciente

Aprueban modificar dictamen en materia de simplificación administrativa de ciencia y tecnología en Yucatán

El proyecto contempla disposiciones que derogan al CIETEY

La Jornada Maya

Aprueban modificar dictamen en materia de simplificación administrativa de ciencia y tecnología en Yucatán

Maestros de secundarias de Yucatán exigen cumplimiento de acuerdos

300 docentes de Secuny se manifestaron desde el parque de San Juan hasta el Palacio de Gobierno

La Jornada

Maestros de secundarias de Yucatán exigen cumplimiento de acuerdos

Mérida: Cecilia Patrón atiende necesidades de los ciudadanos en el Miércoles Ciudadano

En esta ocasión se entregaron 57 lentes del programa Ver Mejor

La Jornada Maya

Mérida: Cecilia Patrón atiende necesidades de los ciudadanos en el Miércoles Ciudadano

Crece en Quintana Roo el segmento de turismo médico y wellness

La entidad ya capta el interés del mercado canadiense y estadunidense; ahora buscan visitantes de Europa y Asia

Ana Ramírez

Crece en Quintana Roo el segmento de turismo médico y wellness