如何持续运行进程：深入理解 Linux `nohup` 命令

在 Linux 系统中，确保进程即使在用户退出或关闭终端后也能持续运行，是许多开发和运维场景中的常见需求。nohup 命令为此提供了一个简单而强大的解决方案，它能够使进程免受终端挂断信号（SIGHUP）的影响，从而保证您的任务不间断地运行。

什么是 `nohup` 命令？

nohup，是 “no hang up” 的缩写，是 Linux 系统中的一个标准命令。它的核心功能是允许进程在启动它的 shell 或终端退出后仍能继续运行。nohup 通过阻止进程或作业接收 SIGHUP（挂断信号）来实现这一点。SIGHUP 信号通常会在关闭或退出终端时发送给所有相关进程，导致它们终止。

`nohup` 命令语法与版本检查

基本语法

nohup 命令的语法非常直观：

nohup command [arguments]

或者，当不带任何参数执行时，通常用于查看其用法：

nohup [options]

检查 `nohup` 版本

您可以使用 --version 参数来查看 nohup 命令的版本信息：

nohup --version

使用 `nohup` 启动进程

要使您的进程或作业即使在您退出 shell 或终端后也能继续运行，只需在命令前加上 nohup。这样，作业将继续在后台运行，而不会被终止。

例如，我们创建一个简单的 Bash 脚本 hello.sh：

#!/bin/bash
echo "Hello World!"

然后使用 nohup 运行此脚本：

nohup ./hello.sh

默认情况下，nohup 命令的标准输出（stdout）和标准错误（stderr）会被重定向到当前目录下的一个文件，通常是 nohup.out。您可以查看此文件来验证输出：

cat nohup.out

自定义输出重定向

如果您希望将输出保存到其他文件中，可以使用重定向操作符 >：

nohup ./hello.sh > output.txt

要将标准错误（stderr）也重定向到与标准输出（stdout）相同的文件，请使用 > filename 2>&1 参数。这里的 2>&1 表示将文件描述符 2（stderr）重定向到文件描述符 1（stdout）所指向的位置：

nohup ./hello.sh > myoutput.txt 2>&1

将进程放入后台

通常，我们希望 nohup 启动的进程在后台运行，而不是阻塞当前的终端。这可以通过在命令末尾添加 & 符号来实现：

nohup command arguments &

例如，在后台持续 ping google.com：

nohup ping google.com &

检查和终止后台进程

要检查进程是否在后台运行（即使重新启动 shell 后），可以使用 pgrep 命令配合其 -a 参数（显示完整命令行）：

pgrep -a ping

如果您想停止或杀死正在运行的进程，请使用 kill 命令，后跟进程 ID (PID)。请注意，这里的 2565 只是一个示例 PID，您需要根据实际情况替换为查询到的 PID：

kill 2565

`nohup`、`screen` 和 `tmux` 的详细比较

在 Linux 中，除了 nohup 之外，还有 screen 和 tmux 这类更高级的工具可以实现会话持久化。理解它们之间的差异对于选择合适的工具至关重要。

nohup：
- 特点：一个基本实用程序，主要用于运行即使在用户注销后也需要持久存在的命令。它通过使命令不受 SIGHUP 信号影响来实现此目的。nohup 还会将标准输出和标准错误重定向到 nohup.out 文件（如果未另外指定）。
- 优点：使用简单，开销很低，适用于简单的长时间运行任务，如脚本或单个应用程序的后台运行。
- 缺点：不提供交互性、会话管理功能或多窗口支持。一旦启动，无法重新连接到该会话进行交互。
screen：
- 特点：提供更高级的终端会话管理解决方案，允许用户在单个会话中创建和管理多个终端窗口。
- 优点：主要功能是可以分离（detach）会话并在以后重新连接（attach），即使从不同的位置也可以。它还提供一定程度的会话持久性，可以承受网络中断或断开连接。
- 缺点：其键绑定和窗口管理系统可能不如现代替代品直观，学习曲线相对较陡。
tmux：
- 特点：被认为是现代且功能强大的终端多路复用器，采用客户端-服务器模型来管理终端会话。它将工作组织到会话中，每个会话可以包含多个窗口，每个窗口可以进一步划分为窗格（pane）。
- 优点：提供了对终端环境的精细控制。tmux 提供出色的交互性，允许用户轻松切换窗口和窗格，调整布局，并有效管理会话。其功能包括高度可定制的键绑定、直观的窗口和窗格管理以及强大的脚本功能，使其成为复杂工作流程的多功能工具。
- 缺点：尽管 tmux 在功能和可用性方面通常被认为更优越，但它可能不会在旧系统上默认安装，且其初始学习曲线可能比 nohup 更陡峭，但从长远来看通常更有益。

总结来说，nohup 适用于简单的、非交互式后台任务；screen 和 tmux 则适用于需要会话管理、多窗口/多任务处理以及频繁连接/断开的场景。

`nohup` 与用户会话的交互行为

nohup 提供的保护主要是针对 SIGHUP 信号，这意味着它对进程在不同会话场景下的行为有所影响：

SSH 会话断开（网络中断、客户端崩溃）：nohup 启动的进程会忽略 SIGHUP 信号，因此即使 SSH 连接意外终止，进程也会继续在服务器上运行。
正常用户注销（例如，输入 exit 或 logout）：nohup 启动的命令将忽略 SIGHUP 信号，即使用户已注销且父 shell 已终止，进程也会持久运行。
关闭终端模拟器窗口：无论是通过 SSH 会话还是在本地 shell 中执行，nohup 启动的进程都会忽略 SIGHUP 信号并继续运行。
系统关机或重启：nohup 命令不提供针对 SIGTERM 或 SIGKILL 等系统级终止信号的保护。因此，所有 nohup 启动的进程将在系统关机或重启期间终止。
进程被手动终止：nohup 提供的免疫力专门针对 SIGHUP 信号。如果将其他信号（如 SIGTERM 或 SIGKILL）直接发送到进程 ID (PID)，进程将终止。
不带 & 运行 nohup（在前台）：如果 nohup 在没有 & 符号的情况下启动命令，终端将保持连接状态，直到命令执行完毕。如果终端会话在此期间关闭，脚本将继续运行，但此操作模式不常见，因为它会阻塞终端。
shell 因会话限制或超时而退出：如果会话因不活动而自动终止（例如，通过 TMOUT 变量或 SSH 服务器配置），nohup 启动的命令将继续运行而不受影响，因为它会忽略因超时触发的 SIGHUP 信号。
nohup.out 无法写入：如果 nohup 无法在当前工作目录写入 nohup.out，它会尝试在用户的主目录 ($HOME/nohup.out) 中创建或追加。如果两次尝试都失败，nohup 命令本身可能会报错退出，或者目标命令可能启动但其输出和错误流会丢失。

理解 `nohup` 的“静默失败”

尽管 nohup 本身很少在没有提示问题的情况下失败（例如无法写入其输出文件），但通过 nohup 执行的命令可能会意外终止，导致用户认为是“静默失败”。这通常不是因为 nohup 出现故障，而是因为启动的命令本身过早退出。

常见的“静默失败”原因包括：

命令内部错误：命令遇到内部错误（例如配置错误或缺少依赖项）、脚本中未处理的错误。
环境变量问题：nohup 执行命令的环境可能与用户的交互式 shell 显著不同且受到更多限制，如果命令依赖于不可用的特定环境变量或 PATH 变量，则可能导致失败。
资源耗尽：命令可能运行一段时间后因资源耗尽（如内存不足或磁盘空间不足）而终止。
交互式输入需求：如果命令意外需要交互式输入（nohup 会从 /dev/null 重定向输入），它可能会退出。
权限问题：命令在其操作期间遇到的权限问题（与 nohup 的初始权限不同）也可能导致其停止。

在这些“静默失败”场景中，nohup 已成功分离进程以忽略挂断信号；随后的失败是命令内部的。从用户断开连接后，“静默”通常是指用户无法直接看到错误信息，因为命令本身的错误信息通常被重定向到 nohup.out（或用户指定的输出文件）。因此，诊断此类问题的第一步是仔细检查此输出文件和相关的系统日志，它们通常包含命令意外终止的原因。

使用 `nohup` 的正确日志记录实践

使用 nohup 进行有效日志记录不仅限于其默认的 nohup.out 文件，它还能确保您的后台进程可追溯和可调试。

重定向输出：
- 分离流：为清晰的错误跟踪，将 stdout 和 stderr 发送到不同的文件：
```
nohup ./my_cmd > app.log 2> app.err &
```
- 组合流：使用自定义名称将所有输出保存在一个位置：
```
nohup ./my_cmd > combined.log 2>&1 &
```
描述性文件名和存储位置：使用描述性文件名（例如，app_$(date +%F).log），并将这些文件存储在指定的日志目录中（例如，/var/log/my_app/ 或项目 logs/ 文件夹），并确保进程具有必要的写入权限。
应用程序日志质量：确保您的应用程序生成结构良好、带有时间戳、具有适当细节和日志级别（如 INFO、DEBUG、ERROR）的日志。
日志轮换（Log Rotation）：nohup 不会轮换日志。对于长时间运行的进程，您需要通过应用程序本身实现日志轮换功能，或使用 logrotate 等外部工具来防止磁盘空间过度使用。
定期查看日志：使用 tail -f（用于实时监控）、less 和 grep 等工具定期查看日志，以检查错误并确保应用程序按预期运行。

通过关注应用程序如何记录日志以及 nohup 如何捕获该输出，您可以保持有效的日志记录策略，便于故障排查和监控。

结论

总而言之，nohup 是一个不可或缺的 Linux 工具，可确保您的关键命令在终端会话结束后仍能持续运行。通过巧妙地忽略 SIGHUP 信号并提供输出重定向机制，它提供了一种简单而可靠的方法来可靠地运行后台进程，为您的基本长期任务带来稳定性和连续性。

关于

关注我获取更多资讯

📢 公众号

💬 个人号

什么是 nohup 命令？

nohup 命令语法与版本检查

基本语法

检查 nohup 版本

使用 nohup 启动进程