中国科学院海洋研究所高性能计算中心计算资源分配原则

  高性能计算机系统由72个节点1152个CPU核心组成,每个节点为4个主频为2.2GHz的四核皓龙(Opteron shanghai),其中36个节点配置为48G内存,36个节点配置为64GB内存,计算网络是20Gb Infiniband。系统总内存4TB,总的存储空间为100TB。

  为有效使用该高性能计算机系统,充分发挥其计算能力,同时根据作业管理系统的工作方式,对计算单元进行分组,并以队列的形式进行划分。同时,限制队列能接受作业规模和运行时间,如果作业规模不在指定队列的限制范围,作业将不被系统接收;如果作业运行时间超出指定队列的上限,作业系统将自动对其中止运行。另外,对某些大规模作业队列将只对部分授权用户开放。

队列 优先级 最大并行规模(cpu核心) 最长运行时间(分钟) 备注
debug 40 32 15 用于调试,运行在调试机器上
bigmem 50 432 无限制 运行在大内存机器上
normal 50 832 无限制 优先运行在小内存机器,在资源不足时也运行在大内存机器上
high 60 832 无限制 优先运行在小内存机器,在资源不足时也运行在大内存机器上
super 80 1120 无限制 无限制, 所有节点, 运行在所有机器上

注:bqueues 命令可以查看队列信息。