Nœud de soumission : mesologin1.univ-fcomte.fr ou mesologin2.univ-fcomte.fr
Nom | Limite de temps | Nombre de slots | Limite slots/user | Limite mémoire/coeur | Type d'application |
---|---|---|---|---|---|
all.q | 8j | 892 | 92 | - | Mémoire partagée : OpenMP, tableaux de tâches, séquentielles |
parallel.q | 8j | 1088 | 128 | 4G/coeur | Mémoire distribuée : MPI spécifique |
tesla.q | 8j | 8 slots, 4 GPU | - | - | calculs GPGPU |
volta.q | 8j | 2 noeuds, 8 GPU | - | - | IA et Deep Learning |
xphi.q | 3j | 12 slots, 4 cartes | - | - | calculs parallèle spécifique |
bigmem.q | 8j | 8 slots, 96G | - | - | Séquentiel, OpenMP |
qconf -sql
ou qstat -g c
Un système de quotas
et de partage équitable (fairshare
) est utilisé pour s'assurer que les ressources (CPU, MEM) soient accessibles à tous les utilisateurs dans les meilleurs délais.
qquotatAll
Le fairshare
est un mécanisme surveillant l'usage des ressources dans le temps, de manière à permettre aux utilisateurs occasionnels de passer plus facilement par rapport à de gros consommateurs en ressource. Pour ce faire, les priorités de chaque job en attente sur le cluster sont ajustées à la volée, ce qui peut se traduire par deux priorités différentes pour des jobs par ailleurs identiques.
La mémoire et les slots sont des ressources consommables, allouées à un job une fois lancé : Pour une meilleure utilisation des machines, nous invitons donc les utilisateurs à bien estimer la mémoire.
Un ensemble d'outils ont été mis en place pour vous aider à connaître la mémoire réellement utilisée par vos calculs.
Durant l'exécution, vous pouvez visualiser la mémoire réellement consommée par vos applications :
qmemview -j <jobid>
A la fin de l'exécution:
qacct -j <jobid>