[Linux-ivv4] batch-queue auf Superdome

Thomas Papenkort t.papenkort at uni-muenster.de
Don Jan 31 11:54:18 CET 2008


Hallo zusammen,

die batch-Queue auf der Superdome speichert die Anzahl der benötigten
CPUs (im Unterschied zu den übrigen Queues) nicht nur in der Resource
nodes, sondern zusätzlich auch in der Resource ncpus. Ein Job, der mit

  qsub -l nodes=1:ppn=8 -q batch

abgeschickt wird, erhält automatisch die Resources

    Resource_List.ncpus = 32
    Resource_List.nodect = 1
    Resource_List.nodes = 1:ppn=8
    Resource_List.walltime = 96:00:00,

belegt also 32 CPUs statt 8. (Nachdem ein einziger solcher Job
gestartet wurde, können deshalb keine neuen mehr ausgeführt
werden. Der aktuell laufende Job 6046 ist ein Beispiel dafür.)

Könnte bitte jemand
a) auf der Dokumentationsseite schreiben, dass Jobs für die
   Batch-Queue mit "-l nodes=1:ppn=N,ncpus=N" gestartet werden sollten
   oder
b) vielleicht sogar den Default-Wert für ncpus automatisch auf den
   Wert von nodes:ppn setzen?

Danke
Thomas Papenkort