Descripci贸n general

La versi贸n actual de Magerit consiste en un cl煤ster de prop贸sito general compuesto por 68聽nodos ThinkSystem SD530, cada uno de ellos equipado con procesadores Intel庐 Xeon庐 Gold 6230, 192聽GiB de RAM y un disco SSD de 480聽GiB. Esta configuraci贸n es capaz de proporcionar una potencia pico de 182.78聽TFLOPS (DP).

Adicionalmente, se dispone de nodos ThinkSystem SR670 con aceleradores (GPU) espec铆ficos:

Tabla 1. Configuraci贸n de nodos que componen Magerit
Cantidad Procesador RAM HD Aceleradores

68聽nodos

2聽脳聽Intel庐 Xeon庐 Gold 6230

(20聽cores @ 2.1聽GHz)

192聽GiB

480聽GiB

(SSD M.2)

4 nodos

2聽脳聽Intel庐 Xeon庐 Gold 6240R

(24聽cores @ 2.4聽GHz)

192聽GiB

128聽GiB

(SSD M.2)

4聽脳聽NVIDIA A100

2 nodos

2聽脳聽Intel庐 Xeon庐 Gold 6230

(20聽cores @ 2.1聽GHz)

192聽GiB

128聽GiB

(SSD M.2)

2聽脳聽NVIDIA V100

Nodos

Aunque todos los nodos son id茅nticos, existen nodos con dos funciones muy diferenciadas:

Nodo Descripci贸n

Interactivos

Son nodos virtualizados que permiten el acceso a la infraestructura desde cualquier dispositivo y lugar del mundo. Desde ellos se realiza gesti贸n de trabajos y el intercambio de datos y resultados.

El acceso se realiza mediante SSH a magerit.cesvima.upm.es utilizando las credenciales de usuario que se facilitan con el alta de la cuenta.

Las sesiones abiertas se cancelan tras 8 horas de inactividad y, dado que no est谩n pensados para ejecuci贸n, se ha establecido un l铆mite de 10聽minutos de CPU para cada proceso que ejecute en ellos.

C贸mputo

Son los nodos en los que se ejecutan los trabajos y que se encuentran aislados del exterior.

Las ejecuciones en estos nodos se realizan mediante trabajos por lotes batch gestionados por un planificador de recursos.

Todos los nodos se interconectan con redes 100 GbE de baja latencia.

Almacenamiento

Todos los nodos de Magerit tienen acceso a un espacio de almacenamiento compartido implementado sobre un sistema de ficheros paralelo denominado BeeGFS.

Cada actividad tiene asignado 1 TB de almacenamiento compartido por todos los miembros y una carpeta de proyecto con el formato /home/<code>/ para almacenar la informaci贸n.

El sistema de ficheros se encuentra controlado por un sistema de cuotas asignadas a cada grupo, es decir, se considera el total de espacio usado independientemente del miembro que lo utiliza.

La coordinaci贸n del uso de este espacio de almacenamiento recae sobre el responsable de la actividad.

Bajo esa carpeta aparecen tres tipos de entradas:

Nodo Descripci贸n

Home de usuario

Cada miembro de proyecto tendr谩 una cuenta de usuario cuya carpeta principal tiene la forma /home/<code>/<user>/ donde puede almacenar su configuraci贸n y datos personales.

Datos compartidos

Los datos, resultados o c贸digos que sean utilizados por varios miembros del proyecto se pueden almacenar en /home/<code>/PROJECT/.

Temporal

Para informaci贸n temporal (logs de ejecuciones, resultados parciales鈥︹) existe la ubicaci贸n scratch en /home/<code>/SCRATCH/.

Cualquier informaci贸n alojada en una carpeta SCRATCH o .cache se considera temporal y ser谩 ignorada.

No se proporciona backup garantizado para ninguna de las ubicaciones. Es responsabilidad de cada usuario y responsable del proyecto realizar y gestionar sus propias copias.

CeSViMaCentro de Supercomputaci贸n y Visualizaci贸n de Madrid