Descripci贸n general

La versi贸n actual de Magerit consiste en un cl煤ster de prop贸sito general compuesto por 68 nodos ThinkSystem SD530, cada uno de ellos equipado con procesadores Intel庐 Xeon庐 Gold 6230 (20 cores @ 2.1 GHz), 192 GB de RAM y un disco SSD de 480 GB.

Esta configuraci贸n es capaz de proporcionar una potencia pico de 182.78 TFLOPS (DP).

Adicionalmente, se dispone de nodos ThinkSystem SR670 con aceleradores (GPU) espec铆ficos:

Cantidad Procesador RAM HD Aceleradores

4 nodos

2 × Intel庐 Xeon庐 Gold 6240R

(24 cores @ 2.4 GHz)

192 GB

128 GB

(SSD M.2)

4 × NVIDIA A100

2 nodos

2 × Intel庐 Xeon庐 Gold 6230

(20 cores @ 2.1 GHz)

192 GB

128 GB

(SSD M.2)

2 × NVIDIA V100

Nodos

Aunque todos los nodos son id茅nticos, existen nodos con dos funciones muy diferenciadas:

Interactivos o de login

Son los nodos que permiten el acceso a la infraestructura desde cualquier dispositivo y lugar del mundo. Desde ellos se realiza gesti贸n de trabajos y el intercambio de datos y resultados.

El acceso se realiza mediante SSH a magerit.cesvima.upm.es utilizando las credenciales de usuario que se facilitan con el alta de la cuenta.

Las sesiones abiertas se cancelan tras 8 horas de inactividad y, dado que no est谩n pensados para ejecuci贸n, se ha establecido un l铆mite de 10 minutos de CPU para cada proceso que ejecute en ellos.

C贸mputo

Son los nodos en los que se ejecutan los trabajos y que se encuentran aislados del exterior.

Las ejecuciones en estos nodos se realizan mediante trabajos por lotes batch gestionados por un planificador de recursos.

Los nodos se interconectan con redes 100 GbE de baja latencia.

Almacenamiento

Todos los nodos de Magerit tienen acceso a un espacio de almacenamiento compartido implementado sobre un sistema de ficheros paralelo denominado BeeGFS.

Cada actividad tiene asignado 1 TB de almacenamiento compartido por todos los miembros y una carpeta de proyecto con el formato /home/<code>/ para almacenar la informaci贸n.

El sistema de ficheros se encuentra controlado por un sistema de cuotas asignadas a cada grupo, es decir, se considera el total de espacio usado independientemente del miembro que lo utiliza.

La coordinaci贸n del uso de este espacio de almacenamiento recae sobre el responsable de la actividad.

Bajo esa carpeta aparecen tres tipos de entradas:

Home de usuario

Cada miembro de proyecto tendr谩 una cuenta de usuario cuya carpeta principal tiene la forma /home/<code>/<user>/ donde puede almacenar su configuraci贸n y datos personales.

Datos compartidos

Los datos, resultados o c贸digos que sean utilizados por varios miembros del proyecto se pueden almacenar en /home/<code>/PROJECT/.

Datos temporales

Para informaci贸n temporal (logs de ejecuciones, resultados parciales…​) existe la ubicaci贸n scratch en /home/<code>/SCRATCH/.

No se proporciona backup garantizado para ninguna de las ubicaciones. Es responsabilidad de cada usuario y responsable del proyecto realizar y gestionar sus propias copias.