- Il y a une liste globale des calculs en cours (jobs) et des calculs en attente des ressources demandées.
- Un utilisateur peut exécuter 80 jobs en même temps et faire 100 soumissions maximum.
- Les partitions, parfois nommées files d’attente, ont des caractéristiques.
- Les partitions risk-xxx ont moins de limitations mais les jobs qui y sont exécutés peuvent être stoppés par une autre soumission faite dans une partition « non-risk ». Autrement dit : Les partitions « risk-nom » sont en mode de préemption. Ne pas hésiter à utiliser les partitions risk-xxx qui auraient pu se nommer overlimit-xxx car elle permettent de soumettre des calculs au delà de limites « classiques ».
Commande MatriCS digest
Commande listant les partitions actives : scontrol show partition | grep PartitionName
Commande listant les paramètres d’une partition : scontrol show partition Nom_Partition
short | normal | bigmem | bigpu | quadgpu | normal-amd | bigmem-amd | fpga | quad-a100 | midmem | gpu | |
Mémoire maximum par nœud | 125 Go | 125 Go | 500 Go | 375 Go | 750 Go | 250 Go | 1000 Go | 1000 Go | 1000 Go | 375 Go | 29 Go |
Nombre de cœurs maximum par nœuds | 28 | 28 | 28 | 40 | 40 | 64 | 64 | 64 | 64 | 40 | 16 |
Processeur | Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz (turbo à 3.30) | Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz (turbo à 3.30) | Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz (turbo à 3.30) | Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz (turbo à 3,7) | Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz (turbo à 3,7) | AMD EPYC 7513 32-Core Processor 2,6GHz (turbo à 3,7) | AMD EPYC 7513 32-Core Processor 2,6GHz (turbo à 3,7) | AMD EPYC 7502 32-Core Processor 2,5GHz (turbo à 3,35) | AMD EPYC 7513 32-Core Processor 2,6GHz (turbo à 3,7) | Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz (turbo à 3,7) | Intel(R) Xeon(R) Silver 4309Y CPU @ 2.80GHz (turbo à 3,6) |
Mémoire maximum par utilisateur | 125 Go | 2000 Go | 2000 Go | 750 Go | 750 Go | 2000 Go | 2000 Go | 2000 Go | 1000 Go | 3000 Go | 29 Go |
Nombre maximum de cœurs par job et par utilisateur | 28 | 448 | 112 | 80 | 40 | 512 | 128 | 128 | 64 | 320 | 16 |
Ratio mémoire optimal par cœur | 4000 Mo | 4 Go 4096 Mo | 16 Go 16384 Mo | 9 Go 9216 Mo | 18 Go 18432 Mo | 4000 Mo | 16000 Mo | 16000 Mo | 16000 Mo | 9 Go 9216 Mo | 1875 Mo |
Temps maximum par job | 5 h (10 h) | 15 jours (50) | 15 jours (50) | 15 jours | 15 jours | 10 jours (15) | 10 jours (15) | 10 jours (15) | 5 jours (10) | 50 jours (5) | 50 jours (5) |
Nombre de nœuds maximum par job | 1 (10) | 12 (16) | 3 (4) | 2 (3) | 1 (2) | 6 (8) | 1 (2) | 1 (2) | 1 | 8 (2) | 1 |
Nombre maximum de GPU par utilisateur | 4 | 4 | 4 | 1 | |||||||
Nombre maximum de FPGA par utilisateur | 6 |
Partitions short et risk-short
Intègre tous les serveurs CPU pour une exécution rapide d’une soumission.
Partitions normal et risk-normal
Intègre 48 serveurs bi-processeur Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz, 128 Go de mémoire.
Partitions bigmem et risk-bigmem
Intègre 12 serveurs bi-processeur Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz, 512 Go de mémoire.
Partitions bigpu et risk-bigpu
Intègre 6 serveurs bi-processeur Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 384 Go de mémoire et 2 cartes GPUs Tesla V100-32G.
Partitions quadgpu et risk-quadgpu
Intègre 2 serveurs bi-processeur Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 768 Go de mémoire et 4 cartes GPUs Tesla V100 SXM2-32G-NVLink.
Partitions normal-amd et risk-normal-amd
File d’attente par défaut. Intègre 24 serveurs bi-processeur AMD EPYC 7513 @ 2.60GHz, 256 Go de mémoire.
Partitions bigmem-amd et risk-bigmem-amd
Intègre 4 serveurs bi-processeur AMD EPYC 7513 @ 2.60GHz, 1 To de mémoire.
Partitions fpga et risk-fpga
Intègre 4 serveurs bi-processeur AMD EPYC 7502 @ 2.50GHz, 1 To de mémoire et 3 cartes FPGA Xilinx U280.
Partitions quad-a100 et risk-quad-a100
Intègre un serveur bi-processeur AMD EPYC 7513 @ 2.60GHz, 1 To de mémoire et 4 GPU Tesla A100 SXM4-40G.
Partition midmem et risk-midmem
Partition midmem réservée au projet ARTISTIC du LRCS. Intègre 8 serveurs bi-processeur Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 384 Go de mémoire.
Partition gpu et risk-gpu
Partition gpu réservée aux chercheurs du LAMFA. Intègre 1 serveur bi-processeur Intel(R) Xeon(R) Silver 4309Y CPU @ 2.80GHz, 32 Go de mémoire et 1 GPU Tesla T4
Partition magma (priorité au logiciel magma).
Intègre 2 serveurs bi-processeur Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz, 512 Go de mémoire
Pour des raisons de licence, l’utilisation du logiciel magma impose le choix de la partition magma et les jobs non-magma sur bignode12 sont susceptibles d’être annulées en cas de demande de job magma.
Temps maximum par job : 50 jours / Nombre de nœuds maximum par job : 1
Partition visugpu
Intègre un serveur bi-processeur Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz, 192 Go de mémoire et une carte GPU Tesla P40
- Mémoire maximum instanciable : 187 Go
- Nombre de cœurs : 36
- Ratio mémoire optimal par cœur : 5 Go (5120 Mo)
- Temps maximum par job : 1 jour