在服务器上做并行计算时,大家经常相互抢节点。用的节点越多,越难以轮到自己的作业。
下面谈谈我的抢节点技巧。
第一:用好查看空闲节点命令。open PBS 查看空闲节点命令:pbsnodes -l free.
如果你的程序具有很好的可扩展性,那么你马上就设置需要的CPU的数量进行计算,而不是盲目设置CPU的数量。如果设置的少了,程序运算的慢了,如果设置的多了,就要排队等CPU,浪费时间。
第二:查看队列。open PBS查看队列的命令:qstat -a,该命令可以查看各个队列的排队情况,还可以看到正在运行的程序的运行时间。看看各个队列的排队情况,那个队列短,提交到哪个队列计算,往往有事半功倍的效果。
有些时候明明空闲CPU数量是够的,但自己提交的作业就是不运行。这可能是已经有别人提交了作业,系统在等候资源。这时你不妨把自己的作业的运行时间缩短一下,再次提交,说不定你就插队成功了。
联系客服