Preguntas frecuentes (FAQ) Magerit

Acceso al sistema

He enviado un trabajo al sistema 驴C贸mo puedo saber el estado en el que se encuentra?

Cada usuario puede ver sus trabajos enviados al sistema con squeue.

Tambi茅n es posible generar un informe m谩s detallado junto al desempe帽o con sstat (si est谩 ejecutando) o con sacct (si ya ha finalizado la ejecuci贸n).

驴Puedo hacer que mi trabajo est茅 menos tiempo esperando?

Una forma de reducir el tiempo de espera es ajustando al m谩ximo los recursos solicitados: reduciendo al m谩ximo el n煤mero de tareas (directivas --ntasks y --cpus-per-task) as铆 como la duraci贸n del trabajo (directiva --time). De esta forma ser谩 m谩s f谩cil que el planificador pueda poner en ejecuci贸n un trabajo que precisa una ventana de tiempo m谩s peque帽a.

Se recomienda ajustar la duraci贸n del trabajo dejando siempre un margen de seguridad (5聽% o 10聽% extra) para evitar que se aborte por falta de tiempo.

驴Cu谩l es la mejor forma de ejecutar varios trabajos que tienen dependencias entre ellos?

Para definir las dependencias se utiliza la directiva --dependency indicando los identificadores de trabajo de los que depende y c贸mo deben haber acabado. Hay m谩s informaci贸n en el manual de sbatch o ejecutando man sbatch en un nodo.

Aplicaciones

Necesito una aplicaci贸n que no aparece instalada en el sistema

Las aplicaciones de terceros, para evitar que existan m煤ltiples copias de la misma aplicaci贸n en el sistema, son instaladas por el equipo de administraci贸n. Solicite su instalaci贸n a trav茅s del Centro de Atenci贸n a Usuarios (CAU).

Las aplicaciones que son instaladas por el usuario son los desarrollos propios del usuario o aquellas que por su dise帽o no permitan el uso compartido por m煤ltiples usuarios.

Necesito una aplicaci贸n que precisa licencia

El software con licencia debe ser siempre controlado por el equipo de administraci贸n y el acceso al mismo estar谩 permitido 煤nicamente a aquellos proyectos/usuarios que hayan acreditado disponer de una licencia v谩lida.

Para que se habilite el acceso al software es necesario enviar una copia de la misma al equipo de administraci贸n a trav茅s del Centro de Atenci贸n a Usuarios (CAU).

No funciona CUDA en una sesi贸n interactiva

Los nodos interactivos son m谩quinas virtuales sin soporte de CUDA. Por ello no tienen instaladas las bibliotecas.

Sin embargo, desde estos nodos es posible ver qu茅 aplicaciones soportan cuda ejecutando module avail cuda.

Para usar cualquier programa CUDA, se debe enviar un trabajo solicitando recursos CUDA y ejecutando los mandatos en el jobfile.

Errores t铆picos

bad interpreter: No such file or directory

La codificaci贸n del retorno de carro es incorrecta, posiblemente usa la codificaci贸n de Windows, y el sistema no es capaz de interpretarlo.

En este caso basta con ejecutar dos2unix sobre fichero para subsanar el problema.

ssh_exchange_identification: Connection closed by remote host

Debido a los ataques recibidos en el sistema, existe un mecanismo de bloqueo autom谩tico de las IPs que intentan realizar accesos fraudulentos. Cuando una IP queda bloqueada se recibe ese mensaje en la conexi贸n.

El bloqueo se produce cuando se realizan m煤ltiples intentos de acceso (m谩s de tres) con credenciales incorrectas (nombre de usuario inv谩lido o contrase帽a incorrecta). Al detectar cualquiera de estas condiciones se bloquea el acceso a cualquier servicio desde esa IP en todos los nodos de login del sistema.

Para liberar el bloqueo, debe enviarse la direcci贸n IP desde la que se realiza la conexi贸n al Centro de Atenci贸n a Usuarios (CAU).

Miscel谩nea

驴C贸mo puedo contactar con el CeSViMa?

La principal fuente de informaci贸n es la p谩gina web del CeSViMa o ponerse en contacto con Centro de Atenci贸n a Usuarios (CAU).

CeSViMaCentro de Supercomputaci贸n y Visualizaci贸n de Madrid