Linux下的定时任务crontab详解
简介
crontab命令主要用于设置命令行或者脚本周期性的执行。该命令从标准输入设备读取指令,并将其存放于文件中,以供之后读取和执行。本文主要讲述crontb命令的基本语法和配置方法。
实际工作中,crontab出现的问题是多种多样的,下面就深入介绍下crontab在具体工作中容易出现的问题和解决问题的办法。
crontab能干啥
crond是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有要执行的任务,如果有要执行的任务,则自动执行该任务。
Linux下的任务调度分为两类,系统任务调度和用户任务调度。
- 系统任务调度:系统周期性所要执行的工作,比如写缓存数据到硬盘、日志清理等。
- 用户任务调度:用户定期要执行的工作,比如用户数据备份、定时邮件提醒等。用户可以使用 crontab 工具来定制自己的计划任务。所有用户定义的crontab 文件都被保存在 /var/spool/cron目录中。其文件名与用户名一致。
关于crontab的用途,在企业实际应用中非常广泛,常见的有定时数据备份、定时系统检测、定时数据收集、定时更新配置、定时生成报表等等。
crontab应用实例
1、crontab使用格式
crontab常用的使用格式有如下两种:
1 2 | crontab [-u user] [file] crontab [-u user] [-e|-l|-r |-i] |
选项含义如下:
- -u user:用来设定某个用户的crontab服务,例如,“-u ixdba”表示设定ixdba用户的crontab服务,此参数一般有root用户来运行。
- file:file是命令文件的名字,表示将file做为crontab的任务列表文件并载入crontab。如果在命令行中没有指定这个文件,crontab命令将接受标准输入(键盘)上键入的命令,并将它们载入crontab。
- -e:编辑某个用户的crontab文件内容。如果不指定用户,则表示编辑当前用户的crontab文件。
- -l:显示某个用户的crontab文件内容,如果不指定用户,则表示显示当前用户的crontab文件内容。
- -r:从/var/spool/cron目录中删除某个用户的crontab文件,如果不指定用户,则默认删除当前用户的crontab文件。
- -i:在删除用户的crontab文件时给确认提示。
2、crontab文件语法
用户所建立的crontab文件中,每一行都代表一项任务,每行的每个字段代表一项设置,它的格式共分为六个字段,前五段是时间设定段,第六段是要执行的命令段,格式如下:
1 2 3 4 5 6 7 8 9 10 | # Example of job definition: .---------------- minute (0 - 59) | .------------- hour (0 - 23) | | .---------- day of month (1 - 31) | | | .------- month (1 - 12) OR jan,feb,mar,apr ... | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat | | | | | * * * * * command/script minute hour day month week command |
一个定时任务的配置共包括6个字段,分别是分、时、日、月、周、命令行或脚本,每一列取值的范围或者含义如上述格式中注释描述。特别注意一点是命令行或者脚本一定要配置成绝对路径。
其中:
minute:表示分钟,可以是从0到59之间的任何整数。
hour:表示小时,可以是从0到23之间的任何整数。
day:表示日期,可以是从1到31之间的任何整数。
month:表示月份,可以是从1到12之间的任何整数。
week:表示星期几,可以是从0到7之间的任何整数,这里的0或7代表星期日。
command:要执行的命令,可以是系统命令,也可以是自己编写的脚本文件。
在以上各个字段中,还可以使用以下特殊字符:
星号():代表所有可能的值,例如month字段如果是星号,则表示在满足其它字段的制约条件后每月都执行该命令操作。
逗号(,):可以用逗号隔开的值指定一个列表范围,例如,“1,2,5,7,8,9”
中杠(-):可以用整数之间的中杠表示一个整数范围,例如“2-6”表示“2,3,4,5,6”
正斜线(/):可以用正斜线指定时间的间隔频率,例如“0-23/2”表示每两小时执行一次。同时正斜线可以和星号一起使用,例如/10,如果用在minute字段,表示每十分钟执行一次。
3、几个crontab例子
1 | 0 /3 /usr/local/apache2/apachectl restart |
表示每隔3个小时重启apache服务一次。
1 | 30 3 6 /webdata/bin/backup.sh |
表示每周六的3点30分执行/webdata/bin/backup.sh脚本的操作。
1 | 0 0 1,20 fsck /dev/sdb8 |
表示每个月的1号和20号检查/dev/sdb8磁盘设备。
1 | 10 5 /5 * echo "">/usr/local/apache2/log/access_log |
表示每个月的5号、10号、15号、20号、25号、30号的5点10分执行清理apache日志操作。
每天晚上10点运行rumenz.sh脚本
1 | 0 22 * * * /root/rumenz.sh |
每月的1,3,7的早上8.30运行rumenz.sh
1 | > 30 8 1,3,7 * * /root/rumenz.sh |
每周六,日的的凌晨2点执行rumenz.sh
1 | > 0 2 * * 6,0 /root/rumenz.txt |
每天的的18点到23点每30分执行rumenz.sh
1 2 3 4 5 | 0,30 18-23 * * /root/rumenz.sh //或者 */30 18-23 * * /root/rumenz.sh |
每天凌晨2点访问一个网址
1 | > 0 2 * * * /usr/bin/curl https://rumenz.com |
crontab每10秒执行一次rumenz.sh
1 2 3 4 5 6 | * * * * * /root/rumenz.sh * * * * * sleep 10;/root/rumenz.sh * * * * * sleep 20;/root/rumenz.sh * * * * * sleep 30;/root/rumenz.sh * * * * * sleep 40;/root/rumenz.sh * * * * * sleep 50;/root/rumenz.sh |
每 90 分钟运行一次rumenz.sh
1 2 | 0 0-21/3 * * * /root/rumenz.sh 30 0-22/3 * * * /root/rumenz.sh |
需要两个表达式实现
每90秒执行一次rumenz.sh
1 2 | */3 * * * * /root/rumenz.sh */3 * * * * sleep 90;/root/rumenz.sh |
需要两个表达式实现
系统级任务调度/etc/crontab
在/etc目录下有一个crontab文件,这个就是系统任务调度的配置文件。
/etc/crontab文件包括下面几行:
1 2 3 4 5 6 7 8 9 | SHELL=/bin/bash PATH=/sbin:/bin:/usr/sbin:/usr/bin MAILTO=root HOME=/ # run-parts 01 * * * * root run-parts /etc/cron.hourly 02 4 * * * root run-parts /etc/cron.daily 22 4 * * 0 root run-parts /etc/cron.weekly 42 4 1 * * root run-parts /etc/cron.monthly |
从上面的示例文件可看出,crontab的任务列表主要由两部分组成:环境变量配置与定时任务配置。可能大家在工作中更多是只用到了任务配置部分。
前四行是用来配置crond任务运行的环境变量,第一行SHELL变量指定了系统要使用哪个shell,这里是bash,第二行PATH变量指定了系统执行命令的路径,第三行MAILTO变量指定了crond的任务执行信息将通过电子邮件发送给root用户,如果MAILTO变量的值为空,则表示不发送任务执行信息给用户,第四行的HOME变量指定了在执行命令或者脚本时使用的主目录。第六至九行就是crontab执行格式的具体写法。
crontab调试解析神器
通常在使用crontab添加任务时,我们会依靠自己已有知识编写定时语句。当需要测试语句是否正确时,还需要在服务器上不断调试,,这种方式太不高效了。有没有一款工具,只要我们给出语句,就能告诉具体执行时间以及对错呢?还真有,下面介绍一款老外开发的crontab在线解析工具。
工具地址:https://crontab.guru
给出这个工具的截图如下:
好用不好用,你试试就知道。
crontab使用的各种坑
1、环境变量问题
当我们刚使用crontab时,运维老鸟们一般会告知所有命令尽量都使用绝对路径,以防错误。这是为什么?这就和我们下面要谈的环境变量有关了。
首先,获取shell终端环境变量,内容如下: