Linux 进程与服务

本文最后更新于:2024年9月8日 晚上

Linux 进程与服务

基本概念

  • 在Linux中,每一个程序都是有自己的一个进程,每一个进程都有一个id号,每一个进程都会有一个父进程。
  • 正在执行的一个或多个相关进程可形成一个作业,使用管道和重定向命令,一个作业可启动多个进程,根据运行方式的不同可将作业分为两大类:
    • 前台作业:运行于前台,用户可对其进行交互操作。
    • 后台作业:运行于后台,不接收终端的输入,但向终端输出执行结果。
  • 服务是按照服务启动模式启动的进程的集合,服务可能包括很多进程,而且启动的进程可能是互相交叉的。

进程

进程的优先级

  • 在Linux 中,所有的进程根据其所处状态,按时间顺序排列成不同的队列系统按一定的策略调度就绪队列中的进程,若用户因为某种原因希望尽快完成某个进程的运行,则可以通过修改进程的优先级来改变其在队列中的排列顺序,从而得以尽快运行。
  • 启动进程的用户或超级用户可以修改进程的优先级,但普通用户只能调低优先级,超级用户既可调低也可调高优先级,在Linux 中,进程优先级的取值为-20~19之间的整数,取值越低,优先级越高,默认为0

ps

ps命令用于报告当前系统的进程状态,可以搭配kill指令随时中断,删除不必要的程序,ps命令是最基本同时也是非常强大的进程查看命令,使用该命令可以确定有哪些进程正在运行和运行的状态,进程是否结束,进程有没有僵死,哪些进程占用了过多的资源等等,总之大部分信息都是可以通过执行该命令得到的。

1
ps [选项]
  • -a:显示所有终端机下执行的程序,除了阶段作业领导者之外。
  • a:显示现行终端机下的所有程序,包括其他用户的程序。
  • -A:显示所有程序。
  • -c:显示CLS和PRI栏位。
  • c:列出程序时,显示每个程序真正的指令名称,而不包含路径,选项或常驻服务的标示。
  • -C<指令名称>:指定执行指令的名称,并列出该指令的程序的状况。
  • -d:显示所有程序,但不包括阶段作业领导者的程序。
  • -e:此选项的效果和指定"A"选项相同。
  • e:列出程序时,显示每个程序所使用的环境变量。
  • -f:显示UID,PPIP,C与STIME栏位。
  • f:用ASCII字符显示树状结构,表达程序间的相互关系。
  • -g<群组名称>:此选项的效果和指定"-G"选项相同,当亦能使用阶段作业领导者的名称来指定。
  • g:显示现行终端机下的所有程序,包括群组领导者的程序。
  • -G<群组识别码>:列出属于该群组的程序的状况,也可使用群组名称来指定。
  • h:不显示标题列。
  • -H:显示树状结构,表示程序间的相互关系。
  • -j或j:采用工作控制的格式显示程序状况。
  • -l或l:采用详细的格式来显示程序状况。
  • L:列出栏位的相关信息。
  • -m或m:显示所有的执行绪。
  • n:以数字来表示USER和WCHAN栏位。
  • -N:显示所有的程序,除了执行ps指令终端机下的程序之外。
  • -p<程序识别码>:指定程序识别码,并列出该程序的状况。
  • p<程序识别码>:此选项的效果和指定"-p"选项相同,只在列表格式方面稍有差异。
  • r:只列出现行终端机正在执行中的程序。
  • -s<阶段作业>:指定阶段作业的程序识别码,并列出隶属该阶段作业的程序的状况。
  • s:采用程序信号的格式显示程序状况。
  • S:列出程序时,包括已中断的子程序资料。
  • -t<终端机编号>:指定终端机编号,并列出属于该终端机的程序的状况。
  • t<终端机编号>:此选项的效果和指定"-t"选项相同,只在列表格式方面稍有差异。
  • -T:显示现行终端机下的所有程序。
  • -u<用户识别码>:此选项的效果和指定"-U"选项相同。
  • u:以用户为主的格式来显示程序状况。
  • -U<用户识别码>:列出属于该用户的程序的状况,也可使用用户名称来指定。
  • U<用户名称>:列出属于该用户的程序的状况。
  • v:采用虚拟内存的格式显示程序状况。
  • -V或V:显示版本信息。
  • -w或w:采用宽阔的格式来显示程序状况,
  • x:显示所有程序,不以终端机来区分。
  • X:采用旧式的Linux i386登陆格式显示程序状况。
  • -y:配合选项"-l"使用时,不显示F(flag)栏位,并以RSS栏位取代ADDR栏位
  • -<程序识别码>:此选项的效果和指定"p"选项相同。

实例

1
2
3
4
5
ps -aux 查看所有的进程。
ps -aux|grep 进程名字 #过滤进程信息

ps -ef #可以查看到父进程的信息。
ps -ef| grep mysql # 看父进程我们一般可以通过目录树结构来查看

pstree

1
pstree -pu # 进程树。
  • -p:显示父id
  • -u:显示用户组。

kill

  • kill 命令用于删除执行中的程序或工作。
1
kill [-s <信息名称或编号>][程序] 或 kill [-l <信息编号>]
  • -l <信息编号>  若不加<信息编号>选项,则 -l 参数会列出全部的信息名称。
  • -s <信息名称或编号>  指定要送出的信息。
  • [程序]  [程序]可以是程序的PID或是PGID,也可以是工作编号。

常用的信号

  • 1 (HUP):重新加载进程。
  • 9 (KILL):杀死一个进程。
  • 15 (TERM):正常停止一个进程。

nohup

  • nohup命令可以将程序以忽略挂起信号的方式运行起来,被运行的程序的输出信息将不会显示到终端。
  • 无论是否将 nohup 命令的输出重定向到终端,输出都将附加到当前目录的 nohup.out 文件中,如果当前目录的 nohup.out 文件不可写,输出重定向到$HOME/nohup.out文件中,如果没有文件能创建或打开以用于追加,那么 command 参数指定的命令不可调用,如果标准错误是一个终端,那么把指定的命令写给标准错误的所有输出作为标准输出重定向到相同的文件描述符。
1
nohup Command [ Arg ... ] [&]
  • Command:要执行的命令。
  • Arg:一些参数,可以指定输出文件。
  • &:让命令在后台执行,终端退出后命令仍旧执行。

实例

  • 使用nohup命令提交作业,如果使用nohup命令提交作业,那么在缺省情况下该作业的所有输出都被重定向到一个名为nohup.out的文件中,除非另外指定了输出文件:
1
nohup command > myout.file 2>&1 &
  • 在上面的例子中,输出被重定向到myout.file文件中。

jobs

  • jobs命令用于显示Linux中的任务列表及任务状态,包括后台运行的任务,该命令可以显示任务号及其对应的进程号,其中,任务号是以普通用户的角度进行的,而进程号则是从系统管理员的角度来看的,一个任务可以对应于一个或者多个进程号。
  • 在Linux系统中执行某些操作时候,有时需要将当前任务暂停调至后台,或有时须将后台暂停的任务重启开启并调至前台,这一序列的操作将会使用到 jobs,bg,和 fg 三个命令以及两个快捷键来完成。
1
jobs(选项)(参数)
  • -l:显示进程号。
  • -p:仅任务对应的显示进程号。
  • -n:显示任务状态的变化。
  • -r:仅输出运行状态(running)的任务。
  • -s:仅输出停止状态(stoped)的任务。
  • 任务标识号:指定要显示的任务识别号。

实例

  • 使用jobs命令显示当前系统的任务列表,输入如下命令:
1
jobs -l               #显示当前系统的任务列表。
  • 上面的命令执行后,将显示出当前系统下的任务列表信息,具体如下所示:
1
[1] + 1903 运行中          find / -name password &
  • 注意:要得到以上输出信息,必须在执行jobs命令之前执行命令find / -name password &,否则,执行jobs命令不会显示任何信息。
  • 其中,输出信息的第一列表示任务编号,第二列表示任务所对应的进程号,第三列表示任务的运行状态,第四列表示启动任务的命令。

bg

  • bg命令用于将作业放到后台运行,使前台可以执行其他任务,该命令的运行效果与在指令后面添加符号&的效果是相同的,都是将其放到系统后台执行。
  • 在Linux系统中执行某些操作时候,有时需要将当前任务暂停调至后台,或有时须将后台暂停的任务重启开启并调至前台,这一序列的操作将会使用到 jobs,bg,和 fg 三个命令以及两个快捷键来完成。
1
bg(参数)
  • 作业标识:指定需要放到后台的作业标识号。

实例

  • 使用bg命令将任务号为1的任务放到后台继续执行,输入如下命令:
1
bg 1            #后台执行任务号为1的任务。
  • 如果系统中只有一个挂起的任务时,即使不为该命令设置参数"1",也可以实现这个功能。
  • 注意:实际上,使用bg命令与在指令后面添加符号"&"的效果是一样的,例如,使用&find / -name password放到后台执行,输入如下命令:
1
find / -name password &

fg

1
fg(参数)
  • 作业标识:指定要放到前台的作业标识号。

实例

  • 使用fg命令将任务号为1的任务从后台执行转换到前台执行,输入如下命令:
1
fg 1          #将任务转换到前台执行。
  • 执行上面的命令后,命令行窗口将显示如下信息:
1
find / -name password       #前台执行命令。

计划任务

at

  • at命令用于在指定时间执行命令,at允许使用一套相当复杂的指定时间的方法,它能够接受在当天的hh:mm(小时:分钟)式的时间指定,假如该时间已过去,那么就放在第二天执行,当然也能够使用midnight(深夜),noon(中午),teatime(饮茶时间,一般是下午4点)等比较模糊的词语来指定时间,用户还能够采用12小时计时制,即在时间后面加上AM(上午)或PM(下午)来说明是上午还是下午,也能够指定命令执行的具体日期,指定格式为month day(月日)或mm/dd/yy(月/日/年)或dd.mm.yy(日。月。年),指定的日期必须跟在指定时间的后面。
  • 上面介绍的都是绝对计时法,其实还能够使用相对计时法,这对于安排不久就要执行的命令是很有好处的,指定格式为:now + count time-units,now就是当前时间,time-units是时间单位,这里能够是minutes(分钟),hours(小时),days(天),weeks(星期),count是时间的数量,究竟是几天,还是几小时,等等,更有一种计时方法就是直接使用today(今天),tomorrow(明天)来指定完成命令的时间。

时间格式

  • HH:MM:在今日的 HH:MM 时刻进行,若该时刻已超过,则明天的 HH:MM 进行此任务。
1
ex> 04:00
  • HH:MM YYYY-MM-DD:强制规定在某年某月的某一天的特殊时刻进行该项任务。
1
ex> 04:00 2009-03-17
  • HH:MM[am|pm] [Month] [Date]:也是一样,强制在某年某月某日的某时刻进行该项任务
1
ex> 04pm March 17
  • HH:MM[am|pm] + number [minutes|hours|days|weeks]:在某个时间点再加几个时间后才进行该项任务
1
2
ex> now + 5 minutes
ex> 04pm + 3 days
1
at(选项)(参数)
  • -f:指定包含具体指令的任务文件。
  • -q:指定新任务的队列名称。
  • -l:显示待执行任务的列表。
  • -c:显示待执行任务的内容。
  • -d:删除指定的待执行任务。
  • -m:任务执行完成后向用户发送E-mail
  • 参数:指定任务执行的日期时间。

实例

  • 三天后的下午 5 点执行/bin/ls:
1
2
3
4
$ at 5pm+3 days
at> /bin/ls
at> <EOT>
job 7 at 2013-01-08 17:00
  • 明天17点钟,输出时间到指定文件内:
1
2
3
4
$ at 17:20 tomorrow
at> date >/root/2013.log
at> <EOT>
job 8 at 2013-01-06 17:20
  • 计划任务设定后,在没有执行之前我们可以用atq命令来查看系统没有执行工作任务:
1
2
3
$ atq
8 2013-01-06 17:20 a root
7 2013-01-08 17:00 a root
  • 删除已经设置的任务:
1
2
3
4
5
6
7
$ atq
8 2013-01-06 17:20 a root
7 2013-01-08 17:00 a root

$ atrm 7
$ atq
8 2013-01-06 17:20 a root
  • 显示已经设置的任务内容:
1
2
3
4
5
6
$ at -c 8
#!/bin/sh
# atrun uid=0 gid=0
# mail root 0
umask 22此处省略n个字符。
date >/root/2013.log

atq

  • 显示系统中待执行的任务列表,也就是列出当前用户的at任务列表。
1
atq(选项)
  • -q:查询指定队列的任务。

实例

1
2
3
4
5
6
7
at now + 10 minutes
at> echo 1111
at> <eot>
job 3 at Fri Apr 26 12:56:00 2013

atq
3 Fri Apr 26 12:56:00 2013 a root

atrm

  • atrm命令用于删除待执行任务队列中的指定任务。
1
atrm(选项)(参数)
  • 任务号:指定待执行队列中要删除的任务。

实例

  • 删除已经排队的任务。
1
2
3
4
5
atq        // 显示当前已经设置的任务。
2 Mon May 17 08:00:00 2010 a root
1 Sat May 15 17:00:00 2010 a root

atrm 2 // 删除任务2

batch

batch命令用于在指定时间,当系统不繁忙时执行任务,用法与at相似。

1
batch(选项)(参数)
  • -f:指定包含具体指令的任务文件。
  • -q:指定新任务的队列名称。
  • -m:任务执行完后向用户发送E-mail
  • 日期时间:指定任务执行的日期时间。

实例

1
2
3
4
batch
at> echo 1234
at> <EOT>
job 5 at Sun Apr 28 08:49:00 2013

crontab

  • crontab命令被用来提交和管理用户的需要周期性执行的任务,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有要执行的任务,如果有要执行的任务,则自动执行该任务。
1
crontab(选项)(参数)
  • 选项
    • -e:编辑该用户的计时器设置。
    • -l:列出该用户的计时器设置。
    • -r:删除该用户的计时器设置。
    • -u<用户名称>:指定要设定计时器的用户名称。
  • 参数
    • crontab文件:指定包含待执行任务的crontab文件。

知识扩展

  • Linux下的任务调度分为两类–系统任务调度用户任务调度
  • 系统任务调度:系统周期性所要执行的工作,比如写缓存数据到硬盘,日志清理等,在/etc目录下有一个crontab文件,这个就是系统任务调度的配置文件。
  • /etc/crontab文件包括下面几行:
1
2
3
4
5
6
7
8
9
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=""HOME=/

# run-parts
51 * * * * root run-parts /etc/cron.hourly
24 7 * * * root run-parts /etc/cron.daily
22 4 * * 0 root run-parts /etc/cron.weekly
42 4 1 * * root run-parts /etc/cron.monthly
  • 前四行是用来配置crond任务运行的环境变量,第一行SHELL变量指定了系统要使用哪个shell,这里是bash,第二行PATH变量指定了系统执行命令的路径,第三行MAILTO变量指定了crond的任务执行信息将通过电子邮件发送给root用户,如果MAILTO变量的值为空,则表示不发送任务执行信息给用户,第四行的HOME变量指定了在执行命令或者脚本时使用的主目录。
  • 用户任务调度:用户定期要执行的工作,比如用户数据备份,定时邮件提醒等,用户可以使用 crontab 工具来定制自己的计划任务,所有用户定义的crontab文件都被保存在/var/spool/cron目录中,其文件名与用户名一致,使用者权限文件如下:
1
2
3
/etc/cron.deny     该文件中所列用户不允许使用crontab命令。
/etc/cron.allow 该文件中所列用户允许使用crontab命令。
/var/spool/cron/ 所有用户crontab文件存放的目录,以用户名命名。
  • crontab文件的含义:用户所建立的crontab文件中,每一行都代表一项任务,每行的每个字段代表一项设置,它的格式共分为六个字段,前五段是时间设定段,第六段是要执行的命令段,格式如下:
1
minute   hour   day   month   week   command     顺序:分时 日月 周。
  • 其中:
    • minute:表示分钟,可以是从0到59之间的任何整数。
    • hour:表示小时,可以是从0到23之间的任何整数。
    • day:表示日期,可以是从1到31之间的任何整数。
    • month:表示月份,可以是从1到12之间的任何整数。
    • week:表示星期几,可以是从0到7之间的任何整数,这里的0或7代表星期日。
    • command:要执行的命令,可以是系统命令,也可以是自己编写的脚本文件。
  • 在以上各个字段中,还可以使用以下特殊字符:
    • 星号(*):代表所有可能的值,例如month字段如果是星号,则表示在满足其它字段的制约条件后每月都执行该命令操作。
    • 逗号(,):可以用逗号隔开的值指定一个列表范围,例如,"1,2,5,7,8,9”
    • 中杠(-):可以用整数之间的中杠表示一个整数范围,例如"2-6”表示"2,3,4,5,6”
    • 正斜线(/):可以用正斜线指定时间的间隔频率,例如"0-23/2”表示每两小时执行一次,同时正斜线可以和星号一起使用,例如*/10,如果用在minute字段,表示每十分钟执行一次。

crond服务

1
2
3
4
/sbin/service crond start    // 启动服务。
/sbin/service crond stop // 关闭服务。
/sbin/service crond restart // 重启服务。
/sbin/service crond reload // 重新载入配置。
  • 查看crontab服务状态:
1
service crond status
  • 手动启动crontab服务:
1
service crond start
  • 查看crontab服务是否已设置为开机启动,执行命令:
1
ntsysv
  • 加入开机自动启动:
1
chkconfig –level 35 crond on

实例

  • 每1分钟执行一次command
1
* * * * * command
  • 每小时的第3和第15分钟执行。
1
3,15 * * * * command
  • 在上午8点到11点的第3和第15分钟执行。
1
3,15 8-11 * * * command
  • 每隔两天的上午8点到11点的第3和第15分钟执行。
1
3,15 8-11 */2 * * command
  • 每个星期一的上午8点到11点的第3和第15分钟执行。
1
3,15 8-11 * * 1 command
  • 每晚的21:30重启smb
1
30 21 * * * /etc/init.d/smb restart
  • 每月1,10,22日的4 : 45重启smb
1
45 4 1,10,22 * * /etc/init.d/smb restart
  • 每周六,周日的1:10重启smb
1
10 1 * * 6,0 /etc/init.d/smb restart
  • 每天18 : 00至23 : 00之间每隔30分钟重启smb
1
0,30 18-23 * * * /etc/init.d/smb restart
  • 每星期六的晚上11:00 pm重启smb
1
0 23 * * 6 /etc/init.d/smb restart
  • 每一小时重启smb
1
* */1 * * * /etc/init.d/smb restart
  • 晚上11点到早上7点之间,每隔一小时重启smb
1
* 23-7/1 * * * /etc/init.d/smb restart
  • 每月的4号与每周一到周三的11点重启smb
1
0 11 4 * mon-wed /etc/init.d/smb restart
  • 一月一号的4点重启smb
1
0 4 1 jan * /etc/init.d/smb restart
  • 每小时执行/etc/cron.hourly目录内的脚本。
1
01 * * * * root run-parts /etc/cron.hourly

服务

service

  • 通过脚本管理程序的状态。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 启动服务
$ sudo service start <service>

# 重新加载服务
$ sudo service reload <service>

# 强制重新加载服务
$ sudo service force-reload <service>

# 停止服务
$ sudo service stop <service>

# 重启服务
$ sudo service restart <service>
  • service:服务名, /etc/init.d//etc/inid/目录下的脚本。

systemctl

  • systemctl命令兼容了service,即systemctl也会去/etc/init.d目录下,查看,执行相关程序。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 启动服务
$ sudo systemctl start <service>

# 开机启动
$ sudo systemctl enable <service>

# 查看服务
$ sudo systemctl status <service>

# 停止服务
$ sudo systemctl stop <service>

# 杀死服务
$ sudo systemctl kill <service>

# 重启服务
$ sudo systemctl restart <service>

Systemd

  • 历史上,Linux 的启动一直采用init进程。
1
2
3
$ sudo /etc/init.d/apache2 start
# 或者
$ service apache2 start
  • 这种方法有两个缺点。
    • 启动时间长:init进程是串行启动,只有前一个进程启动完,才会启动下一个进程。
    • 启动脚本复杂:init进程只是执行启动脚本,不管其他事情,脚本需要自己处理各种情况,这往往使得脚本变得很长。
  • Systemd 就是为了解决这些问题而诞生的,它的设计目标是,为系统的启动和管理提供一套完整的解决方案。
  • 根据 Linux 惯例,字母d是守护进程(daemon)的缩写,Systemd 这个名字的含义,就是它要守护整个系统。
  • 使用了 Systemd,就不需要再用init了,Systemd 取代了initd,成为系统的第一个进程(PID 等于 1),其他进程都是它的子进程。
  • Systemd 的优点是功能强大,使用方便,缺点是体系庞大,非常复杂,事实上,现在还有很多人反对使用 Systemd,理由就是它过于复杂,与操作系统的其他部分强耦合,违反"keep simple, keep stupid"的Unix 哲学。

Systemd 命令组

  • Systemd 并不是一个命令,而是一组命令,涉及到系统管理的方方面面。

systemctl

systemctl是 Systemd 的主命令,用于管理系统和服务。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 启动服务
$ sudo systemctl start <service>

# 开机启动
$ sudo systemctl enable <service>

# 查看服务
$ sudo systemctl status <service>

# 停止服务
$ sudo systemctl stop <service>

# 杀死服务
$ sudo systemctl kill <service>

# 重启服务
$ sudo systemctl restart <service>

注意:

  • 对于那些支持 Systemd 的软件,安装的时候,会自动在/usr/lib/systemd/system目录添加一个配置文件。
  • enable命令相当于在/etc/systemd/system目录添加一个符号链接,指向/usr/lib/systemd/system里面的httpd.service文件。
  • 这是因为开机时,Systemd只执行/etc/systemd/system目录里面的配置文件,这也意味着,如果把修改后的配置文件放在该目录,就可以达到覆盖原始配置的效果。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
# 重启系统
$ sudo systemctl reboot

# 关闭系统,切断电源
$ sudo systemctl poweroff

# CPU停止工作
$ sudo systemctl halt

# 暂停系统
$ sudo systemctl suspend

# 让系统进入冬眠状态
$ sudo systemctl hibernate

# 让系统进入交互式休眠状态
$ sudo systemctl hybrid-sleep

# 启动进入救援状态(单用户状态)
$ sudo systemctl rescue

systemd-analyze

systemd-analyze命令用于查看启动耗时。

1
2
3
4
5
6
7
8
9
10
11
# 查看启动耗时
$ systemd-analyze

# 查看每个服务的启动耗时
$ systemd-analyze blame

# 显示瀑布状的启动过程流
$ systemd-analyze critical-chain

# 显示指定服务的启动流
$ systemd-analyze critical-chain atd.service

hostnamectl

hostnamectl命令用于查看当前主机的信息。

1
2
3
4
5
# 显示当前主机的信息
$ hostnamectl

# 设置主机名
$ sudo hostnamectl set-hostname rhel7

localectl

localectl命令用于查看本地化设置。

1
2
3
4
5
6
# 查看本地化设置
$ localectl

# 设置本地化参数
$ sudo localectl set-locale LANG=en_GB.utf8
$ sudo localectl set-keymap en_GB

timedatectl

timedatectl命令用于查看当前时区设置。

1
2
3
4
5
6
7
8
9
10
# 查看当前时区设置
$ timedatectl

# 显示所有可用的时区
$ timedatectl list-timezones

# 设置当前时区
$ sudo timedatectl set-timezone America/New_York
$ sudo timedatectl set-time YYYY-MM-DD
$ sudo timedatectl set-time HH:MM:SS

loginctl

loginctl命令用于查看当前登录的用户。

1
2
3
4
5
6
7
8
# 列出当前session
$ loginctl list-sessions

# 列出当前登录用户
$ loginctl list-users

# 列出显示指定用户的信息
$ loginctl show-user ruanyf

Unit

  • Systemd 可以管理所有系统资源,不同的资源统称为 Unit(单位)
  • Unit 一共分成12种。
    • Service unit:系统服务。
    • Target unit:多个 Unit 构成的一个组。
    • Device Unit:硬件设备。
    • Mount Unit:文件系统的挂载点。
    • Automount Unit:自动挂载点。
    • Path Unit:文件或路径。
    • Scope Unit:不是由 Systemd 启动的外部进程。
    • Slice Unit:进程组。
    • Snapshot Unit:Systemd 快照,可以切回某个快照。
    • Socket Unit:进程间通信的 Socket
    • Swap Unit:swap 文件。
    • Timer Unit:定时器。

查看Unit

systemctl list-units命令可以查看当前系统的所有 Unit

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 列出正在运行的 Unit
$ systemctl list-units

# 列出所有Unit,包括没有找到配置文件的或者启动失败的
$ systemctl list-units --all

# 列出所有没有运行的 Unit
$ systemctl list-units --all --state=inactive

# 列出所有加载失败的 Unit
$ systemctl list-units --failed

# 列出所有正在运行的,类型为 service 的 Unit
$ systemctl list-units --type=service

Unit 的状态

systemctl status命令用于查看系统状态和单个 Unit 的状态。

1
2
3
4
5
6
7
8
# 显示系统状态
$ systemctl status

# 显示单个 Unit 的状态
$ sysystemctl status bluetooth.service

# 显示远程主机的某个 Unit 的状态
$ systemctl -H root@rhel7.example.com status httpd.service

除了status命令,systemctl还提供了三个查询状态的简单方法,主要供脚本内部的判断语句使用。

1
2
3
4
5
6
7
8
# 显示某个 Unit 是否正在运行
$ systemctl is-active application.service

# 显示某个 Unit 是否处于启动失败状态
$ systemctl is-failed application.service

# 显示某个 Unit 服务是否建立了启动链接
$ systemctl is-enabled application.service

Unit 管理

对于用户来说,最常用的是下面这些命令,用于启动和停止 Unit(主要是 service)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
# 立即启动一个服务
$ sudo systemctl start apache.service

# 立即停止一个服务
$ sudo systemctl stop apache.service

# 重启一个服务
$ sudo systemctl restart apache.service

# 杀死一个服务的所有子进程
$ sudo systemctl kill apache.service

# 重新加载一个服务的配置文件
$ sudo systemctl reload apache.service

# 重载所有修改过的配置文件
$ sudo systemctl daemon-reload

# 显示某个 Unit 的所有底层参数
$ systemctl show httpd.service

# 显示某个 Unit 的指定属性的值
$ systemctl show -p CPUShares httpd.service

# 设置某个 Unit 的指定属性
$ sudo systemctl set-property httpd.service CPUShares=500

依赖关系

  • Unit 之间存在依赖关系:A 依赖于 B,就意味着 Systemd 在启动 A 的时候,同时会去启动 B
  • systemctl list-dependencies命令列出一个 Unit 的所有依赖。
1
$ systemctl list-dependencies nginx.service

上面命令的输出结果之中,有些依赖是 Target 类型(详见下文),默认不会展开显示,如果要展开 Target,就需要使用--all参数。

1
$ systemctl list-dependencies --all nginx.service

Unit的配置文件

概述

  • 每一个 Unit 都有一个配置文件,告诉 Systemd 怎么启动这个 Unit
  • Systemd 默认从目录/etc/systemd/system/读取配置文件,但是,里面存放的大部分文件都是符号链接,指向目录/usr/lib/systemd/system/,真正的配置文件存放在那个目录。
  • systemctl enable命令用于在上面两个目录之间,建立符号链接关系。
1
2
3
$ sudo systemctl enable clamd@scan.service
# 等同于
$ sudo ln -s '/usr/lib/systemd/system/clamd@scan.service' '/etc/systemd/system/multi-user.target.wants/clamd@scan.service'
  • 如果配置文件里面设置了开机启动,systemctl enable命令相当于激活开机启动。
  • 与之对应的,systemctl disable命令用于在两个目录之间,撤销符号链接关系,相当于撤销开机启动。
1
$ sudo systemctl disable clamd@scan.service
  • 配置文件的后缀名,就是该 Unit 的种类,比如sshd.socket,如果省略,Systemd 默认后缀名为.service,所以sshd会被理解成sshd.service

配置文件的状态

systemctl list-unit-files命令用于列出所有配置文件。

1
2
3
4
5
# 列出所有配置文件
$ systemctl list-unit-files

# 列出指定类型的配置文件
$ systemctl list-unit-files --type=service

这个命令会输出一个列表。

1
2
3
4
5
6
$ systemctl list-unit-files

UNIT FILE STATE
chronyd.service enabled
clamd@.service static
clamd@scan.service disabled

这个列表显示每个配置文件的状态,一共有四种。

  • enabled:已建立启动链接。
  • disabled:没建立启动链接。
  • static:该配置文件没有[Install]部分(无法执行),只能作为其他配置文件的依赖。
  • masked:该配置文件被禁止建立启动链接。

注意,从配置文件的状态无法看出,该 Unit 是否正在运行,这必须执行前面提到的systemctl status命令。

1
$ systemctl status bluetooth.service

一旦修改配置文件,就要让 Systemd 重新加载配置文件,然后重新启动,否则修改不会生效。

1
2
$ sudo systemctl daemon-reload
$ sudo systemctl restart httpd.service

配置文件的格式

  • 配置文件就是普通的文本文件,可以用文本编辑器打开。
  • systemctl cat命令可以查看配置文件的内容。
1
2
3
4
5
6
7
8
9
10
11
$ systemctl cat atd.service

[Unit]
Description=ATD daemon

[Service]
Type=forking
ExecStart=/usr/bin/atd

[Install]
WantedBy=multi-user.target
  • 从上面的输出可以看到,配置文件分成几个区块,每个区块的第一行,是用方括号表示的区别名,比如[Unit],注意,配置文件的区块名和字段名,都是大小写敏感的。
  • 每个区块内部是一些等号连接的键值对。
1
2
3
4
5
[Section]
Directive1=value
Directive2=value

. . .
  • 注意:键值对的等号两侧不能有空格。

配置文件的区块

[Unit]区块通常是配置文件的第一个区块,用来定义 Unit 的元数据,以及配置与其他 Unit 的关系,它的主要字段如下。

  • Description:简短描述。
  • Documentation:文档地址。
  • Requires:当前 Unit 依赖的其他 Unit,如果它们没有运行,当前 Unit 会启动失败。
  • Wants:与当前 Unit 配合的其他 Unit,如果它们没有运行,当前 Unit 不会启动失败。
  • BindsTo:与Requires类似,它指定的 Unit 如果退出,会导致当前 Unit 停止运行。
  • Before:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之后启动。
  • After:如果该字段指定的 Unit 也要启动,那么必须在当前 Unit 之前启动。
  • Conflicts:这里指定的 Unit 不能与当前 Unit 同时运行。
  • Condition...:当前 Unit 运行必须满足的条件,否则不会运行。
  • Assert...:当前 Unit 运行必须满足的条件,否则会报启动失败。

[Install]通常是配置文件的最后一个区块,用来定义如何启动,以及是否开机启动,它的主要字段如下。

  • WantedBy:它的值是一个或多个 Target,当前 Unit 激活时(enable)符号链接会放入/etc/systemd/system目录下面以 Target 名 + .wants后缀构成的子目录中。
  • RequiredBy:它的值是一个或多个 Target,当前 Unit 激活时,符号链接会放入/etc/systemd/system目录下面以 Target 名 + .required后缀构成的子目录中。
  • Alias:当前 Unit 可用于启动的别名。
  • Also:当前 Unit 激活(enable)时,会被同时激活的其他 Unit

[Service]区块用来 Service 的配置,只有 Service 类型的 Unit 才有这个区块,它的主要字段如下。

  • Type:定义启动时的进程行为,它有以下几种值。
  • Type=simple:默认值,执行ExecStart指定的命令,启动主进程。
  • Type=forking:以 fork 方式从父进程创建子进程,创建后父进程会立即退出。
  • Type=oneshot:一次性进程,Systemd 会等当前服务退出,再继续往下执行。
  • Type=dbus:当前服务通过D-Bus启动。
  • Type=notify:当前服务启动完毕,会通知Systemd,再继续往下执行。
  • Type=idle:若有其他任务执行完毕,当前服务才会运行。
  • ExecStart:启动当前服务的命令。
  • ExecStartPre:启动当前服务之前执行的命令。
  • ExecStartPost:启动当前服务之后执行的命令。
  • ExecReload:重启当前服务时执行的命令。
  • ExecStop:停止当前服务时执行的命令。
  • ExecStopPost:停止当其服务之后执行的命令。
  • RestartSec:自动重启当前服务间隔的秒数。
  • Restart:定义何种情况 Systemd 会自动重启当前服务,可能的值包括always(总是重启),on-success,on-failure,on-abnormal,on-abort,on-watchdog
  • TimeoutSec:定义 Systemd 停止当前服务之前等待的秒数。
  • Environment:指定环境变量。

Unit 配置文件的完整字段清单,请参考官方文档

Target

  • 启动计算机的时候,需要启动大量的 Unit,如果每一次启动,都要一一写明本次启动需要哪些 Unit,显然非常不方便,Systemd 的解决方案就是 Target
  • 简单说,Target 就是一个 Unit 组,包含许多相关的 Unit,启动某个 Target 的时候,Systemd 就会启动里面所有的 Unit,从这个意义上说,Target 这个概念类似于"状态点",启动某个 Target 就好比启动到某种状态。
  • 传统的init启动模式里面,有 RunLevel 的概念,跟 Target 的作用很类似,不同的是,RunLevel 是互斥的,不可能多个 RunLevel 同时启动,但是多个 Target 可以同时启动。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# 查看当前系统的所有 Target
$ systemctl list-unit-files --type=target

# 查看一个 Target 包含的所有 Unit
$ systemctl list-dependencies multi-user.target

# 查看启动时的默认 Target
$ systemctl get-default

# 设置启动时的默认 Target
$ sudo systemctl set-default multi-user.target

# 切换 Target 时,默认不关闭前一个 Target 启动的进程
# systemctl isolate 命令改变这种行为
# 关闭前一个 Target 里面所有不属于后一个 Target 的进程
$ sudo systemctl isolate multi-user.target
  • Target 与传统 RunLevel 的对应关系如下。
1
2
3
4
5
6
7
8
9
Traditional runlevel      New target name     Symbolically linked to...

Runlevel 0 | runlevel0.target -> poweroff.target
Runlevel 1 | runlevel1.target -> rescue.target
Runlevel 2 | runlevel2.target -> multi-user.target
Runlevel 3 | runlevel3.target -> multi-user.target
Runlevel 4 | runlevel4.target -> multi-user.target
Runlevel 5 | runlevel5.target -> graphical.target
Runlevel 6 | runlevel6.target -> reboot.target
  • 它与init进程的主要差别如下。
    • 默认的 RunLevel(在/etc/inittab文件设置)现在被默认的 Target 取代,位置是/etc/systemd/system/default.target,通常符号链接到graphical.target(图形界面)或者multi-user.target(多用户命令行)
    • 启动脚本的位置,以前是/etc/init.d目录,符号链接到不同的 RunLevel 目录(比如/etc/rc3.d,/etc/rc5.d等),现在则存放在/lib/systemd/system/etc/systemd/system目录。
    • 配置文件的位置,以前init进程的配置文件是/etc/inittab,各种服务的配置文件存放在/etc/sysconfig目录,现在的配置文件主要存放在/lib/systemd目录,在/etc/systemd目录里面的修改可以覆盖原始设置。

日志管理

  • Systemd 统一管理所有 Unit 的启动日志,带来的好处就是,可以只用journalctl一个命令,查看所有日志(内核日志和应用日志),日志的配置文件是/etc/systemd/journald.conf
  • journalctl功能强大,用法非常多。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
# 查看所有日志(默认情况下,只保存本次启动的日志)
$ sudo journalctl

# 查看内核日志(不显示应用日志)
$ sudo journalctl -k

# 查看系统本次启动的日志
$ sudo journalctl -b
$ sudo journalctl -b -0

# 查看上一次启动的日志(需更改设置)
$ sudo journalctl -b -1

# 查看指定时间的日志
$ sudo journalctl --since="2012-10-30 18:17:16"
$ sudo journalctl --since "20 min ago"
$ sudo journalctl --since yesterday
$ sudo journalctl --since "2015-01-10" --until "2015-01-11 03:00"
$ sudo journalctl --since 09:00 --until "1 hour ago"

# 显示尾部的最新10行日志
$ sudo journalctl -n

# 显示尾部指定行数的日志
$ sudo journalctl -n 20

# 实时滚动显示最新日志
$ sudo journalctl -f

# 查看指定服务的日志
$ sudo journalctl /usr/lib/systemd/systemd

# 查看指定进程的日志
$ sudo journalctl _PID=1

# 查看某个路径的脚本的日志
$ sudo journalctl /usr/bin/bash

# 查看指定用户的日志
$ sudo journalctl _UID=33 --since today

# 查看某个 Unit 的日志
$ sudo journalctl -u nginx.service
$ sudo journalctl -u nginx.service --since today

# 实时滚动显示某个 Unit 的最新日志
$ sudo journalctl -u nginx.service -f

# 合并显示多个 Unit 的日志
$ journalctl -u nginx.service -u php-fpm.service --since today

# 查看指定优先级(及其以上级别)的日志,共有8级
# 0: emerg
# 1: alert
# 2: crit
# 3: err
# 4: warning
# 5: notice
# 6: info
# 7: debug
$ sudo journalctl -p err -b

# 日志默认分页输出,--no-pager 改为正常的标准输出
$ sudo journalctl --no-pager

# 以 JSON 格式(单行)输出
$ sudo journalctl -b -u nginx.service -o json

# 以 JSON 格式(多行)输出,可读性更好
$ sudo journalctl -b -u nginx.serviceqq
-o json-pretty

# 显示日志占据的硬盘空间
$ sudo journalctl --disk-usage

# 指定日志文件占据的最大空间
$ sudo journalctl --vacuum-size=1G

# 指定日志文件保存多久
$ sudo journalctl --vacuum-time=1years

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!