Linux 之大数据定制篇-Shell 编程

为什么要学习Shell 编程

Linux 运维工程师在进行服务器集群管理时，需要编写Shell 程序来进行服务器管理。
对于JavaEE 和Python 程序员来说，工作的需要，你的老大会要求你编写一些Shell 脚本进行程序或者是服务器的维护，比如编写一个定时备份数据库的脚本。
对于大数据程序员来说，需要编写Shell 程序来管理集群

Shell 是什么

Shell 是一个命令行解释器，它为用户提供了一个向Linux 内核发送请求以便运行程序的界面系统级程序，用户可以用Shell 来启动、挂起、停止甚至是编写一些程序。

看一个示意图

在这里插入图片描述

Shell 脚本的执行方式

脚本格式要求

脚本以#!/bin/bash 开头
脚本需要有可执行权限

编写第一个Shell 脚本

需求说明：创建一个Shell 脚本，输出hello world!

vim hello.sh

#!/bin/bash
echo "hello,world~"

脚本的常用执行方式

方式1(输入脚本的绝对路径或相对路径)

说明：首先要赋予helloworld.sh 脚本的+x 权限，再执行脚本

比如./hello.sh 或者使用绝对路径/root/shcode/hello.sh

方式2(sh+脚本)

说明：不用赋予脚本+x 权限，直接执行即可。

比如sh hello.sh , 也可以使用绝对路径

Shell 的变量

Shell 变量介绍

Linux Shell 中的变量分为，系统变量和用户自定义变量。

系统变量：$HOME、$PWD、$SHELL、$USER 等等，比如： echo $HOME 等等..

显示当前shell 中所有变量：set

shell 变量的定义

基本语法

定义变量：变量名=值
撤销变量：unset 变量
声明静态变量：readonly 变量，注意：不能unset

快速入门

案例1：定义变量A
案例2：撤销变量A
案例3：声明静态的变量B=2，不能unset

#!/bin/bash
#案例1：定义变量A
A=100
#输出变量需要加上$
echo A=$A
echo "A=$A"
#案例2：撤销变量A
unset A
echo "A=$A"
#案例3：声明静态的变量B=2，不能unset
readonly B=2
echo "B=$B"
#unset B

shell 变量的定义

定义变量的规则

变量名称可以由字母、数字和下划线组成，但是不能以数字开头。5A=200(×)
等号两侧不能有空格
变量名称一般习惯为大写，这是一个规范，我们遵守即可

将命令的返回值赋给变量

A=`date`反引号，运行里面的命令，并把结果返回给变量A

A=$(date) 等价于反引号

列如

C=`date`
D=$(date)
echo "C=$C"
echo "D=$D"

设置环境变量

基本语法

export 变量名=变量值（功能描述：将shell 变量输出为环境变量/全局变量）
source 配置文件（功能描述：让修改后的配置信息立即生效）
echo $变量名（功能描述：查询环境变量的值）

在这里插入图片描述

快速入门

在/etc/profile 文件中定义TOMCAT_HOME 环境变量
查看环境变量TOMCAT_HOME 的值
在另外一个shell 程序中使用TOMCAT_HOME

在这里插入图片描述

**注意：**在输出TOMCAT_HOME 环境变量前，需要让其生效source /etc/profile

#将指令返回的结果赋给变量
:<<!
C=`date`
D=$(date)
echo "C=$C"
echo "D=$D"
!
#使用环境变量TOMCAT_HOME
echo "tomcat_home=$TOMCAT_HOME"

shell 脚本的多行注释

:<<!

 内容

!

位置参数变量

介绍

当我们执行一个shell 脚本时，如果希望获取到命令行的参数信息，就可以使用到位置参数变量比如： ./myshell.sh 100 200 , 这个就是一个执行shell 的命令行，可以在myshell 脚本中获取到参数信息

基本语法

$n （功能描述：n 为数字，$0 代表命令本身，$1-$9 代表第一到第九个参数，十以上的参数，十以上的参数需要用大括号包含，如${10}）

$* （功能描述：这个变量代表命令行中所有的参数，$*把所有的参数看成一个整体）

$@（功能描述：这个变量也代表命令行中所有的参数，不过$@把每个参数区分对待）

$#（功能描述：这个变量代表命令行中所有参数的个数）

位置参数变量

案例：编写一个shell 脚本position.sh ，在脚本中获取到命令行的各个参数信息

在这里插入图片描述

预定义变量

基本介绍

就是shell 设计者事先已经定义好的变量，可以直接在shell 脚本中使用

基本语法

$$ （功能描述：当前进程的进程号（PID））
$! （功能描述：后台运行的最后一个进程的进程号（PID））
$？（功能描述：最后一次执行的命令的返回状态。如果这个变量的值为0，证明上一个命令正确执行；如果这个变量的值为非0（具体是哪个数，由命令自己来决定），则证明上一个命令执行不正确了。）

应用实例

在一个shell 脚本中简单使用一下预定义变量

名字为preVar.sh

#!/bin/bash
echo "当前执行的进程id=$$"
#以后台的方式运行一个脚本，并获取他的进程号
/root/shcode/myshell.sh &
echo "最后一个后台方式运行的进程id=$!"
echo "执行的结果是=$?"

运算符

基本介绍

学习如何在shell 中进行各种运算操作。

基本语法

“$((运算式))”或“

$[运算式]”或者expr m + n //expression 表达式
注意expr 运算符间要有空格, 如果希望将expr 的结果赋给某个变量，使用``
expr m - n

expr *, /, % 乘，除，取余

应用实例

oper.sh

.案例1：计算（2+3）X4 的值

案例2：请求出命令行的两个参数[整数]的和20 50

#!/bin/bash
#案例1：计算（2+3）X4的值
#使用第一种方式
RES1=$(((2+3)*4))
echo "res1=$RES1"
#使用第二种方式, 推荐使用
RES2=$[(2+3)*4]
echo "res2=$RES2"
#使用第三种方式 expr
TEMP=`expr 2 + 3`
RES4=`expr $TEMP \* 4` 
echo "temp=$TEMP"
echo "res4=$RES4" 
#案例2：请求出命令行的两个参数[整数]的和 20 50
SUM=$[$1+$2]
echo "sum=$SUM"

条件判断

判断语句

基本语法

[ condition ]（注意condition 前后要有空格）

#非空返回true，可使用$?验证（0 为true，>1 为false）

应用实例

[ wyx ] 返回true
[ ] 返回false
[ condition ] && echo OK || echo notok 条件满足，执行后面的语句

判断语句

常用判断条件

= 字符串比较
两个整数的比较
-lt 小于
-le 小于等于little equal
-eq 等于
-gt 大于
-ge 大于等于
-ne 不等于

按照文件权限进行判断3

-r 有读的权限
-w 有写的权限
-x 有执行的权限
按照文件类型进行判断
-f 文件存在并且是一个常规的文件
-e 文件存在
-d 文件存在并是一个目录

应用实例

案例1：“ok"是否等于"ok”

判断语句：使用=

案例2：23 是否大于等于22

判断语句：使用-ge

案例3：/root/shcode/aaa.txt 目录中的文件是否存在

判断语句：使用-f

#!/bin/bash
#案例1："ok"是否等于"ok"
#判断语句：使用 =
if [ "ok" = "ok" ]
then
	echo "equal"
fi
#案例2：23是否大于等于22
#判断语句：使用 -ge
if [ 23 -ge 22 ]
then 
	echo "大于"
fi
#案例3：/root/shcode/aaa.txt 目录中的文件是否存在
#判断语句： 使用 -f 
if [ -f /root/shcode/aaa.txt ]
then 
	echo "存在"
fi
#看几个案例
if [ wyx ]
then 
	echo "hello,wyx"
fi

流程控制

if 判断

基本语法
if [ 条件判断式]
then
代码
fi

或者, 多分支

if [ 条件判断式]
then
代码
elif [条件判断式]
then
代码
fi

注意事项：[ 条件判断式]，中括号和条件判断式之间必须有空格

应用实例

ifCase.sh

案例：请编写一个shell 程序，如果输入的参数，大于等于60，则输出"及格了"，如果小于60,则输出"不及格"

#!/bin/bash
#案例：请编写一个shell程序，如果输入的参数，大于等于60，则输出 "及格了"，如果小于60,则输出 "不及格"
if [ $1 -ge 60 ]
then 
	echo "及格了"
elif [ $1 -lt 60 ] 
then
	echo "不及格"
fi

case 语句

基本语法
case $变量名in
"值1"）
如果变量的值等于值1，则执行程序1
;;
"值2"）
如果变量的值等于值2，则执行程序2
;;
…省略其他分支…
*）
如果变量的值都不是以上的值，则执行此程序
;;
esac

应用实例

testCase.sh

案例1 ：当命令行参数是1 时，输出"周一", 是2 时，就输出"周二"，其它情况输出"other"

#!/bin/bash
#案例1 ：当命令行参数是 1 时，输出 "周一", 是2 时，就输出"周二"， 其它情况输出  "other"
case $1 in
"1")
echo "周一"
;;
"2")
echo "周二"
;;
*)
echo "other..."
;;
esac

for 循环

基本语法1

for 变量in 值1 值2 值3…
do
程序/代码
done

应用实例testFor1.sh

案例1 ：打印命令行输入的参数[这里可以看出 $* 和$ @ 的区别]

#!/bin/bash
#案例1 ：打印命令行输入的参数 [这里可以看出$* 和 $@ 的区别]
#注意 $* 是把输入的参数，当做一个整体，所以，只会输出一句
for i in "$*"
do 
	echo "num is $i"
done
#使用 $@来获取输入的参数，注意，这时是分别对待，所以有几个参数，就输出几句
echo "======================================"
for j in "$@"
do
	echo "num is $j"
done

基本语法2

for (( 初始值;循环控制条件;变量变化))
do
程序/代码
done

应用实例

testFor2.sh

案例1 ：从1 加到100 的值输出显示

#!/bin/bash
#案例1 ：从1加到100的值输出显示, 如何把 100做成一个变量
#定义一个变量 SUM
SUM=0
for(( i=1; i<=$1; i++))
do
#写上你的业务代码
	SUM=$[$SUM+$i]
done
echo "总和SUM=$SUM"

while 循环

基本语法1
while [ 条件判断式]
do
程序/代码
done
注意：while 和[有空格，条件判断式和[也有空格

应用实例

testWhile.sh

案例1 ：从命令行输入一个数n，统计从1+…+ n 的值是多少？

#!/bin/bash
#案例1 ：从命令行输入一个数n，统计从 1+..+ n 的值是多少？
SUM=0
i=0
while [ $i -le $1 ]
do
	SUM=$[$SUM+$i]
	#i自增
	i=$[$i+1]
done
echo "执行结果=$SUM"

read 读取控制台输入

基本语法

read(选项)(参数)

选项：

-p：指定读取值时的提示符；

-t：指定读取值时等待的时间（秒），如果没有在指定的时间内输入，就不再等待了。。

参数

变量：指定读取值的变量名

应用实例

testRead.sh

案例1：读取控制台输入一个NUM1 值

案例2：读取控制台输入一个NUM2 值，在10 秒内输入。

#!/bin/bash
#案例1：读取控制台输入一个NUM1 值
read -p "请输入一个数NUM1=" NUM1
echo "你输入的NUM1=$NUM1"
#案例2：读取控制台输入一个NUM2 值，在10 秒内输入。
read -t 10 -p "请输入一个数NUM2=" NUM2
echo "你输入的NUM2=$NUM2"

函数

函数介绍

shell 编程和其它编程语言一样，有系统函数，也可以自定义函数。系统函数中，我们这里就介绍两个。

系统函数

basename 基本语法

功能：返回完整路径最后/ 的部分，常用于获取文件名

basename [pathname] [suffix]

basename [string] [suffix] （功能描述：basename 命令会删掉所有的前缀包括最后一个（‘/’）字符，然后将字符串显示出来。

选项：

suffix 为后缀，如果suffix 被指定了，

basename 会将pathname 或string 中的suffix 去掉。

dirname 基本语法

功能：返回完整路径最后/ 的前面的部分，常用于返回路径部分

dirname 文件绝对路径（功能描述：从给定的包含绝对路径的文件名中去除文件名（非目录的部分），然后返回剩下的路径（目录的部分））

应用实例

案例1：请返回/home/aaa/test.txt 的"test.txt" 部分
```
 		basename /home/aaa/test.txt
```
案例1：请返回/home/aaa/test.txt 的/home/aaa
```
 	dirname /home/aaa/test.txt
```

自定义函数

基本语法
[ function ] funname[()]
{
Action;
[return int;]
}
调用直接写函数名：funname [值]

应用实例

案例1：计算输入两个参数的和(动态的获取)， getSum

#!/bin/bash
#案例1：计算输入两个参数的和(动态的获取)， getSum

#定义函数 getSum
function getSum() {
	
	SUM=$[$n1+$n2]
	echo "和是=$SUM"
}

#输入两个值
read -p "请输入一个数n1=" n1
read -p "请输入一个数n2=" n2
#调用自定义函数
getSum $n1 $n2

Shell 编程综合案例

需求分析

每天凌晨2:30 备份数据库hspedu 到/data/backup/db
备份开始和备份结束能够给出相应的提示信息
备份后的文件要求以备份时间为文件名，并打包成.tar.gz 的形式，比如：2021-03-12_230201.tar.gz
在备份的同时，检查是否有10 天前备份的数据库文件，如果有就将其删除。
画一个思路分析图

在这里插入图片描述

代码

#备份目录
BACKUP=/data/backup/db
#当前时间
DATETIME=$(date +%Y-%m-%d_%H%M%S)
echo $DATETIME
#数据库的地址
HOST=localhost
#数据库用户名
DB_USER=root
#数据库密码
DB_PW=#自己的密码
#备份的数据库名
DATABASE=hspedu
#创建备份目录, 如果不存在，就创建
[ ! -d "${BACKUP}/${DATETIME}" ] && mkdir -p "${BACKUP}/${DATETIME}"
#备份数据库
mysqldump -u${DB_USER} -p${DB_PW} --host=${HOST} -q -R --databases ${DATABASE} | gzip >
${BACKUP}/${DATETIME}/$DATETIME.sql.gz
#将文件处理成tar.gz
cd ${BACKUP}
tar -zcvf $DATETIME.tar.gz ${DATETIME}
#删除对应的备份目录
rm -rf ${BACKUP}/${DATETIME}
#删除10 天前的备份文件
find ${BACKUP} -atime +10 -name "*.tar.gz" -exec rm -rf {} \;
echo "备份数据库${DATABASE} 成功~"