bstop
将未完成的任务挂起。
语法
bstop [-a] [-app application_profile_name] [-C suspend_reason] [-g job_group_name] [-J job_name] [-m host_name | -m host_group] [-q queue_name] [-sla service_class_name] [-u user_name | -u user_group | -u all] [0] [job_ID ... | "job_ID[index]"] ...
bstop [-h | -V]
描述
默认的,bstop发送SIGSTOP信号到顺序作业,发送SIGTSTP信号到并行作业。必须指定job ID或者-g、-J、-m、-u、-q。设置job ID为0则可以挂起多个作业。不能将已经处于挂起状态的作业挂起。只有root或者LSF管理员可以操作其他人提交的job。通过bresume命令恢复挂起作业继续运行。
对于用户停止的作业(状态为“USUSP”),管理员可以使用bstop命令来阻止用户恢复作业。
以下命令类似:
bkill -s STOP:挂起作业
bkill -s TSTP:挂起并行作业
bkill -s CONT:恢复作业
如果信号请求无法到达作业执行主机,LSF将在主机可达时重试该操作。LSF重试最近的信号请求
参数
-
0
挂起满足其他参数指定的所有作业 (-g, -m, -q, -u, and -J)。
-
-a
挂起所有作业。
-
-app
application_profile_name只挂起与指定应用程序配置文件关联的作业。必须指定已存在的应用程序配置文件。
-
-C
suspend_reason指定挂起作业的原因,最大长度为4095个字符。该原因会在bist -l命令的回显信息中显示。
-
-g
job_group_name只挂起指定作业组中的作业。
-
-J
job_name只挂起具有指定名称的作业。
通配符(' * ')可以在作业名称中的任何位置使用,但不能出现在数组索引中。例如,模式' job* '返回' jobA '和' jobarray[1] '。' AAA[1] '模式返回任务数组中名称中包含' AAA '的第一个元素。然而,模式“job1[*]”不返回任何东西,因为通配符在数组索引中。
-
-m
host_name| -mhost_group只挂起分配给指定主机或主机组的作业。
-
-q
queue_name
只挂起指定队列中的作业。
-
-sla
service_class_name挂起属于指定服务类的任务。
-
-u
user_name| -uuser_group| -u all -
job_ID... | "job_ID[index]" ...
只挂起指定的作业。可以在这里指定任何用户提交的作业,而不使用-u选项。
-
-h
-
-V
示例
bstop 314
bstop -m hostA
普通用户执行,挂起用户提交的到hostA的最后一个job。
bstop -u jsmith 0
挂起jsmith提交的所有作业。
bstop -u all
bstop -u all 0
bstop -g /risk_group/consolidate 0
挂起作业组 /risk_group/consolidate中的所有作业。
bstop -app fluent 0