Linux 之大数据定制篇-Shell 编程
为什么要学习Shell 编程
- Linux 运维工程师在进行服务器集群管理时,需要编写Shell 程序来进行服务器管理。
- 对于JavaEE 和Python 程序员来说,工作的需要,你的老大会要求你编写一些Shell 脚本进行程序或者是服务器的维护,比如编写一个定时备份数据库的脚本。
- 对于大数据程序员来说,需要编写Shell 程序来管理集群
Shell 是什么
Shell 是一个命令行解释器,它为用户提供了一个向Linux 内核发送请求以便运行程序的界面系统级程序,用户可以用Shell 来启动、挂起、停止甚至是编写一些程序。
看一个示意图
Shell 脚本的执行方式
脚本格式要求
- 脚本以#!/bin/bash 开头
- 脚本需要有可执行权限
编写第一个Shell 脚本
需求说明:创建一个Shell 脚本,输出hello world!
- vim hello.sh
#!/bin/bash
echo "hello,world~"
脚本的常用执行方式
- 方式1(输入脚本的绝对路径或相对路径)
说明:首先要赋予helloworld.sh 脚本的+x 权限, 再执行脚本
比如./hello.sh 或者使用绝对路径/root/shcode/hello.sh
- 方式2(sh+脚本)
说明:不用赋予脚本+x 权限,直接执行即可。
比如sh hello.sh , 也可以使用绝对路径
Shell 的变量
Shell 变量介绍
-
Linux Shell 中的变量分为,系统变量和用户自定义变量。
-
系统变量:$HOME、$PWD、$SHELL、$USER 等等,比如: echo $HOME 等等..
- 显示当前shell 中所有变量:set
shell 变量的定义
基本语法
- 定义变量:变量名=值
- 撤销变量:unset 变量
- 声明静态变量:readonly 变量,注意:不能unset
快速入门
- 案例1:定义变量A
- 案例2:撤销变量A
- 案例3:声明静态的变量B=2,不能unset
#!/bin/bash
#案例1:定义变量A
A=100
#输出变量需要加上$
echo A=$A
echo "A=$A"
#案例2:撤销变量A
unset A
echo "A=$A"
#案例3:声明静态的变量B=2,不能unset
readonly B=2
echo "B=$B"
#unset B
shell 变量的定义
定义变量的规则
- 变量名称可以由字母、数字和下划线组成,但是不能以数字开头。5A=200(×)
- 等号两侧不能有空格
- 变量名称一般习惯为大写, 这是一个规范,我们遵守即可
将命令的返回值赋给变量
-
A=`date`反引号,运行里面的命令,并把结果返回给变量A
-
A=$(date) 等价于反引号
列如
C=`date`
D=$(date)
echo "C=$C"
echo "D=$D"
设置环境变量
基本语法
- export 变量名=变量值(功能描述:将shell 变量输出为环境变量/全局变量)
- source 配置文件(功能描述:让修改后的配置信息立即生效)
- echo $变量名(功能描述:查询环境变量的值)
快速入门
- 在/etc/profile 文件中定义TOMCAT_HOME 环境变量
- 查看环境变量TOMCAT_HOME 的值
- 在另外一个shell 程序中使用TOMCAT_HOME
**注意:**在输出TOMCAT_HOME 环境变量前,需要让其生效source /etc/profile
#将指令返回的结果赋给变量
:<<!
C=`date`
D=$(date)
echo "C=$C"
echo "D=$D"
!
#使用环境变量TOMCAT_HOME
echo "tomcat_home=$TOMCAT_HOME"
shell 脚本的多行注释
:<<!
内容
!
位置参数变量
介绍
当我们执行一个shell 脚本时,如果希望获取到命令行的参数信息,就可以使用到位置参数变量比如: ./myshell.sh 100 200 , 这个就是一个执行shell 的命令行,可以在myshell 脚本中获取到参数信息
基本语法
$n (功能描述:n 为数字,$0 代表命令本身,$1-$9 代表第一到第九个参数,十以上的参数,十以上的参数需要用大括号包含,如${10})
$* (功能描述:这个变量代表命令行中所有的参数,$*把所有的参数看成一个整体)
$@(功能描述:这个变量也代表命令行中所有的参数,不过$@把每个参数区分对待)
$#(功能描述:这个变量代表命令行中所有参数的个数)
位置参数变量
案例:编写一个shell 脚本position.sh , 在脚本中获取到命令行的各个参数信息
预定义变量
基本介绍
就是shell 设计者事先已经定义好的变量,可以直接在shell 脚本中使用
基本语法
- $$ (功能描述:当前进程的进程号(PID))
- $! (功能描述:后台运行的最后一个进程的进程号(PID))
- $?(功能描述:最后一次执行的命令的返回状态。如果这个变量的值为0,证明上一个命令正确执行;如果这个变量的值为非0(具体是哪个数,由命令自己来决定),则证明上一个命令执行不正确了。)
应用实例
在一个shell 脚本中简单使用一下预定义变量
名字为preVar.sh
#!/bin/bash
echo "当前执行的进程id=$$"
#以后台的方式运行一个脚本,并获取他的进程号
/root/shcode/myshell.sh &
echo "最后一个后台方式运行的进程id=$!"
echo "执行的结果是=$?"
运算符
基本介绍
学习如何在shell 中进行各种运算操作。
基本语法
-
“$((运算式))”或“
$[运算式]”或者expr m + n //expression 表达式
-
注意expr 运算符间要有空格, 如果希望将expr 的结果赋给某个变量,使用``
-
expr m - n
- expr *, /, % 乘,除,取余
应用实例
oper.sh
.案例1:计算(2+3)X4 的值
案例2:请求出命令行的两个参数[整数]的和20 50
#!/bin/bash
#案例1:计算(2+3)X4的值
#使用第一种方式
RES1=$(((2+3)*4))
echo "res1=$RES1"
#使用第二种方式, 推荐使用
RES2=$[(2+3)*4]
echo "res2=$RES2"
#使用第三种方式 expr
TEMP=`expr 2 + 3`
RES4=`expr $TEMP \* 4`
echo "temp=$TEMP"
echo "res4=$RES4"
#案例2:请求出命令行的两个参数[整数]的和 20 50
SUM=$[$1+$2]
echo "sum=$SUM"
条件判断
判断语句
基本语法
[ condition ](注意condition 前后要有空格)
#非空返回true,可使用$?验证(0 为true,>1 为false)
应用实例
[ wyx ] 返回true
[ ] 返回false
[ condition ] && echo OK || echo notok 条件满足,执行后面的语句
判断语句
常用判断条件
- = 字符串比较
- 两个整数的比较
-lt 小于
-le 小于等于little equal
-eq 等于
-gt 大于
-ge 大于等于
-ne 不等于
-
按照文件权限进行判断3
-r 有读的权限
-w 有写的权限
-x 有执行的权限 -
按照文件类型进行判断
-f 文件存在并且是一个常规的文件
-e 文件存在
-d 文件存在并是一个目录
应用实例
案例1:“ok"是否等于"ok”
判断语句:使用=
案例2:23 是否大于等于22
判断语句:使用-ge
案例3:/root/shcode/aaa.txt 目录中的文件是否存在
判断语句: 使用-f
#!/bin/bash
#案例1:"ok"是否等于"ok"
#判断语句:使用 =
if [ "ok" = "ok" ]
then
echo "equal"
fi
#案例2:23是否大于等于22
#判断语句:使用 -ge
if [ 23 -ge 22 ]
then
echo "大于"
fi
#案例3:/root/shcode/aaa.txt 目录中的文件是否存在
#判断语句: 使用 -f
if [ -f /root/shcode/aaa.txt ]
then
echo "存在"
fi
#看几个案例
if [ wyx ]
then
echo "hello,wyx"
fi
流程控制
if 判断
基本语法
if [ 条件判断式]
then
代码
fi
或者, 多分支
if [ 条件判断式]
then
代码
elif [条件判断式]
then
代码
fi
注意事项:[ 条件判断式],中括号和条件判断式之间必须有空格
应用实例
ifCase.sh
案例:请编写一个shell 程序,如果输入的参数,大于等于60,则输出"及格了",如果小于60,则输出"不及格"
#!/bin/bash
#案例:请编写一个shell程序,如果输入的参数,大于等于60,则输出 "及格了",如果小于60,则输出 "不及格"
if [ $1 -ge 60 ]
then
echo "及格了"
elif [ $1 -lt 60 ]
then
echo "不及格"
fi
case 语句
基本语法
case $变量名in
"值1")
如果变量的值等于值1,则执行程序1
;;
"值2")
如果变量的值等于值2,则执行程序2
;;
…省略其他分支…
*)
如果变量的值都不是以上的值,则执行此程序
;;
esac
应用实例
testCase.sh
案例1 :当命令行参数是1 时,输出"周一", 是2 时,就输出"周二", 其它情况输出"other"
#!/bin/bash
#案例1 :当命令行参数是 1 时,输出 "周一", 是2 时,就输出"周二", 其它情况输出 "other"
case $1 in
"1")
echo "周一"
;;
"2")
echo "周二"
;;
*)
echo "other..."
;;
esac
for 循环
基本语法1
for 变量in 值1 值2 值3…
do
程序/代码
done
应用实例testFor1.sh
案例1 :打印命令行输入的参数[这里可以看出 ∗ 和 * 和 ∗和@ 的区别]
#!/bin/bash
#案例1 :打印命令行输入的参数 [这里可以看出$* 和 $@ 的区别]
#注意 $* 是把输入的参数,当做一个整体,所以,只会输出一句
for i in "$*"
do
echo "num is $i"
done
#使用 $@来获取输入的参数,注意,这时是分别对待,所以有几个参数,就输出几句
echo "======================================"
for j in "$@"
do
echo "num is $j"
done
基本语法2
for (( 初始值;循环控制条件;变量变化))
do
程序/代码
done
应用实例
testFor2.sh
案例1 :从1 加到100 的值输出显示
#!/bin/bash
#案例1 :从1加到100的值输出显示, 如何把 100做成一个变量
#定义一个变量 SUM
SUM=0
for(( i=1; i<=$1; i++))
do
#写上你的业务代码
SUM=$[$SUM+$i]
done
echo "总和SUM=$SUM"
while 循环
基本语法1
while [ 条件判断式]
do
程序/代码
done
注意:while 和[有空格,条件判断式和[也有空格
应用实例
testWhile.sh
案例1 :从命令行输入一个数n,统计从1+…+ n 的值是多少?
#!/bin/bash
#案例1 :从命令行输入一个数n,统计从 1+..+ n 的值是多少?
SUM=0
i=0
while [ $i -le $1 ]
do
SUM=$[$SUM+$i]
#i自增
i=$[$i+1]
done
echo "执行结果=$SUM"
read 读取控制台输入
基本语法
read(选项)(参数)
选项:
-p:指定读取值时的提示符;
-t:指定读取值时等待的时间(秒),如果没有在指定的时间内输入,就不再等待了。。
参数
变量:指定读取值的变量名
应用实例
testRead.sh
案例1:读取控制台输入一个NUM1 值
案例2:读取控制台输入一个NUM2 值,在10 秒内输入。
#!/bin/bash
#案例1:读取控制台输入一个NUM1 值
read -p "请输入一个数NUM1=" NUM1
echo "你输入的NUM1=$NUM1"
#案例2:读取控制台输入一个NUM2 值,在10 秒内输入。
read -t 10 -p "请输入一个数NUM2=" NUM2
echo "你输入的NUM2=$NUM2"
函数
函数介绍
shell 编程和其它编程语言一样,有系统函数,也可以自定义函数。系统函数中,我们这里就介绍两个。
系统函数
basename 基本语法
功能:返回完整路径最后/ 的部分,常用于获取文件名
basename [pathname] [suffix]
basename [string] [suffix] (功能描述:basename 命令会删掉所有的前缀包括最后一个(‘/’)字符,然后将字符串显示出来。
选项:
suffix 为后缀,如果suffix 被指定了,
basename 会将pathname 或string 中的suffix 去掉。
dirname 基本语法
功能:返回完整路径最后/ 的前面的部分,常用于返回路径部分
dirname 文件绝对路径(功能描述:从给定的包含绝对路径的文件名中去除文件名(非目录的部分),然后返回剩下的路径(目录的部分))
应用实例
-
案例1:请返回/home/aaa/test.txt 的"test.txt" 部分
basename /home/aaa/test.txt
-
案例1:请返回/home/aaa/test.txt 的/home/aaa
dirname /home/aaa/test.txt
自定义函数
基本语法
[ function ] funname[()]
{
Action;
[return int;]
}
调用直接写函数名:funname [值]
应用实例
案例1:计算输入两个参数的和(动态的获取), getSum
#!/bin/bash
#案例1:计算输入两个参数的和(动态的获取), getSum
#定义函数 getSum
function getSum() {
SUM=$[$n1+$n2]
echo "和是=$SUM"
}
#输入两个值
read -p "请输入一个数n1=" n1
read -p "请输入一个数n2=" n2
#调用自定义函数
getSum $n1 $n2
Shell 编程综合案例
需求分析
- 每天凌晨2:30 备份数据库hspedu 到/data/backup/db
- 备份开始和备份结束能够给出相应的提示信息
- 备份后的文件要求以备份时间为文件名,并打包成.tar.gz 的形式,比如:2021-03-12_230201.tar.gz
- 在备份的同时,检查是否有10 天前备份的数据库文件,如果有就将其删除。
- 画一个思路分析图
代码
#备份目录
BACKUP=/data/backup/db
#当前时间
DATETIME=$(date +%Y-%m-%d_%H%M%S)
echo $DATETIME
#数据库的地址
HOST=localhost
#数据库用户名
DB_USER=root
#数据库密码
DB_PW=#自己的密码
#备份的数据库名
DATABASE=hspedu
#创建备份目录, 如果不存在,就创建
[ ! -d "${BACKUP}/${DATETIME}" ] && mkdir -p "${BACKUP}/${DATETIME}"
#备份数据库
mysqldump -u${DB_USER} -p${DB_PW} --host=${HOST} -q -R --databases ${DATABASE} | gzip >
${BACKUP}/${DATETIME}/$DATETIME.sql.gz
#将文件处理成tar.gz
cd ${BACKUP}
tar -zcvf $DATETIME.tar.gz ${DATETIME}
#删除对应的备份目录
rm -rf ${BACKUP}/${DATETIME}
#删除10 天前的备份文件
find ${BACKUP} -atime +10 -name "*.tar.gz" -exec rm -rf {} \;
echo "备份数据库${DATABASE} 成功~"