bstop

139 阅读2分钟

bstop

将未完成的任务挂起。

语法

bstop [-a] [-app application_profile_name] [-C suspend_reason] [-g job_group_name] [-J job_name] [-m host_name | -m host_group] [-q queue_name] [-sla service_class_name] [-u user_name | -u user_group | -u all] [0] [job_ID ... | "job_ID[index]"] ...

bstop [-h | -V]

描述

默认的,bstop发送SIGSTOP信号到顺序作业,发送SIGTSTP信号到并行作业。必须指定job ID或者-g、-J、-m、-u、-q。设置job ID为0则可以挂起多个作业。不能将已经处于挂起状态的作业挂起。只有root或者LSF管理员可以操作其他人提交的job。通过bresume命令恢复挂起作业继续运行。

对于用户停止的作业(状态为“USUSP”),管理员可以使用bstop命令来阻止用户恢复作业。

以下命令类似:

bkill -s STOP:挂起作业 bkill -s TSTP:挂起并行作业 bkill -s CONT:恢复作业

如果信号请求无法到达作业执行主机,LSF将在主机可达时重试该操作。LSF重试最近的信号请求

参数

  • 0

    挂起满足其他参数指定的所有作业 (-g, -m, -q, -u, and -J)。

  • -a

    挂起所有作业。

  • -app application_profile_name

    只挂起与指定应用程序配置文件关联的作业。必须指定已存在的应用程序配置文件。

  • -C suspend_reason

    指定挂起作业的原因,最大长度为4095个字符。该原因会在bist -l命令的回显信息中显示。

  • -g job_group_name

    只挂起指定作业组中的作业。

  • -J job_name

    只挂起具有指定名称的作业。

    通配符(' * ')可以在作业名称中的任何位置使用,但不能出现在数组索引中。例如,模式' job* '返回' jobA '和' jobarray[1] '。' AAA[1] '模式返回任务数组中名称中包含' AAA '的第一个元素。然而,模式“job1[*]”不返回任何东西,因为通配符在数组索引中。

  • -m host_name | -m host_group

    只挂起分配给指定主机或主机组的作业。

  • -q queue_name

只挂起指定队列中的作业。

  • -sla service_class_name

    挂起属于指定服务类的任务。

  • -u user_name | -u user_group | -u all

  • job_ID ... | "job_ID[index]" ...

只挂起指定的作业。可以在这里指定任何用户提交的作业,而不使用-u选项。

  • -h

  • -V

示例

bstop 314
bstop -m hostA

普通用户执行,挂起用户提交的到hostA的最后一个job。

bstop -u jsmith 0

挂起jsmith提交的所有作业。

bstop -u all 
bstop -u all 0 
bstop -g /risk_group/consolidate 0

挂起作业组 /risk_group/consolidate中的所有作业。

bstop -app fluent 0