ubuntu应用深度守护

24 阅读5分钟

一、 问题呈现:进程离奇失踪

我在上一篇文章中写了ubuntu部署deb包的方法,然后最近在在例行监测中发现 linux-myApp 应用未运行。通过终端执行 ps -ef | grep linux-myApp 发现,仅返回搜索命令grep本身的进程,原有的应用进程完全消失。

我初步诊断应用已关闭。由于现场机器可能存在无人值守重启的情况,应该是意外或者人为断电导致,需通过日志确认它是“正常关闭”还是“启动失败”。


二、 定位分析:抽丝剥茧

1. 系统日志中的“启动死循环”

输入sudo grep "linux-myApp" /var/log/syslog调取 syslog 发现,系统曾多次尝试自动拉起应用,但均告失败。

  • 报错核心Exec binary ... does not exist: No such file or directory
  • 结论:系统预设的自动启动路径与实际安装路径不匹配,导致应用在服务器重启后无法“回家”。

2. 定位原因

上面的日志内容意味着我的应用可能已经被卸载、被移动了位置,或者安装路径与系统预期的路径不符。

我输入

sudo find / -name "*linuxApp*.desktop" 2>/dev/null

发现还是可以找到快捷方式的,然后我像之前那样先查找到快捷方式的真名。

再执行快捷方式的启动

nohub linux-myApp --no-sandbox > /dev/null 2>&1 &

最后执行ps -ef grep linux-myApp,发现启动无效,输出内容有Exit 127,这是找不到命令的意思。说明快捷方式已经失效了,最后用sudo find / -type f -name "linux-myApp*" 2>/dev/null命令找到真实的物理路径为/usr/bin/linux-myApp

  • 路径误区:快捷方式中仅写了 Exec=linux-myApp。但在远程 SSH 环境下直接运行该命令会触发 Exit 127(找不到命令)。
  • 真身定位:通过全盘搜索,确认程序真实物理路径为 /usr/bin/linux-myApp

三、 技术难点:消失的 DISPLAY 变量

通过上面的分析,我一开始还以应用被人卸载了,但全局又找到了应用,那为何快捷方式会失效呢?

在排查过程中,最终发现应用即便路径正确也无法通过 SSH 手动启动,这是因为缺失了关键配置:DISPLAY=:0

  • 现象:之前应用在现场机器上运行正常,是因为它在本地桌面会话中自动获取了图形显示权。
  • 冲突点:当我们通过 远程 SSH 尝试重启或使用 系统服务 (Systemd) 自动启动时,环境变得非常“纯净”,没有图形环境信息。应用不知道该把界面投射到哪台显示器,导致进程瞬间崩溃。
  • 解决逻辑:显式声明 DISPLAY=:0。这相当于给了应用一张“物理屏幕准入证”,强制要求它关联到机器的第一块物理显示屏上。这是解决“远程无法启动”和“服务启动即崩”的核心钥匙。

要避免这个问题,你可以尝试用这种方式启动试一下:

# 1. 强制赋予权限
sudo chmod +x /usr/bin/linux-myApp

# 2. 指定显示设备并启动(:0 通常是主显示器)
export DISPLAY=:0
nohup /usr/bin/linux-myApp --no-sandbox > /tmp/offshore_debug.log 2>&1 &

四、 解决方案:构建“工业级”守护体系

为了应对现场服务器频繁重启的复杂环境,最好还是建立一个守护服务,这样才能闭环:

1. 建立 Systemd 自动化守护

将应用托管给系统,不再依赖手动 nohup。这个脚本直接在xshell中粘贴就可以用了,app名字你得改成自己的。

#!/bin/bash

# 1. 定义应用名称和路径
APP_NAME="linux-myApp"
APP_PATH="/usr/bin/linux-myApp"
SERVICE_FILE="/etc/systemd/system/linuxApp.service"

echo "开始配置 linuxApp 应用守护服务..."

# 2. 清理当前运行中的重复进程
echo "清理现有进程..."
sudo pkill -f $APP_NAME || true

# 3. 确保执行权限
echo "检查执行权限..."
sudo chmod +x $APP_PATH

# 4. 写入 Systemd 服务配置文件
echo "创建服务文件..."
sudo bash -c "cat > $SERVICE_FILE" <<EOF
[Unit]
Description=linuxApp App Service
After=network.target

[Service]
Type=simple
User=$USER
Environment=DISPLAY=:0
ExecStart=$APP_PATH --no-sandbox
Restart=always
RestartSec=10
StandardOutput=journal
StandardError=journal

[Install]
WantedBy=multi-user.target
EOF

# 5. 重载配置并启动服务
echo "启动服务中..."
sudo systemctl daemon-reload
sudo systemctl enable linuxApp.service
sudo systemctl restart linuxApp.service

echo "-----------------------------------------------"
echo "配置完成!"
echo "你可以通过以下命令查看状态:"
echo "sudo systemctl status linuxApp.service"
echo "-----------------------------------------------"
  • 关键配置

  • ExecStart=/usr/bin/linux-myApp --no-sandbox (使用绝对路径)

  • Environment=DISPLAY=:0 (核心:确保在无人工登录时也能找到屏幕)

  • Restart=always (崩溃或重启后 10 秒内自动复活)

  • 运行验证:配置后,服务显示为 active (running),内存稳定在 321.6M。

2. 修复前端快捷方式(面向现场人员)

由于快捷方式失效了,如果你担心现场人员无法使用,你得同步修改 /usr/share/applications/linuxApp.desktop

# 修正桌面快捷方式的 Exec 路径为绝对路径,并添加必要参数
sudo sed -i 's|^Exec=.*|Exec=/usr/bin/linux-myApp --no-sandbox|' /usr/share/applications/linuxApp.desktop

# 刷新系统图标缓存,确保修改立即生效
sudo update-desktop-database /usr/share/applications/
  • 改动:将执行路径修正为绝对路径 /usr/bin/linux-myApp
  • 意义:确保现场工作人员双击桌面图标时,能够绕过环境变量,直接调用正确的程序文件。

五、 总结

文章中用到的应用名都是自定义的,如果你正好看到这篇文章,这些命令中的应用名都得改成你自己的。不过思路才是最重要的,总结一下:

  1. 路径硬核化:放弃环境变量简写,全线使用 /usr/bin/ 绝对路径。
  2. 环境显式化:显式注入 DISPLAY=:0,解决了远程运维与系统服务无法调用显卡的顽疾。
  3. 自愈能力:现在,即使现场服务器意外重启,Systemd 也会在网络和图形界面就绪后,自动根据 DISPLAY=:0 引导应用“回家”。

目前状态:应用已实现开机自启、掉线自愈、双击有效。后续若需查看重启时间,只需执行 journalctl -u linuxApp.service 即可,非常圆满,希望对你也有用!