【Linux】环境变量及相关指令

一、环境变量的基本概念

其实，我们早就听说过环境变量，比如在学习 JAVA / Python 的时候，会在 Windows 上配置环境变量：

环境变量到底是什么呢？

环境变量（environment variables）一般是指在操作系统中用来指定操作系统运行环境的一些参数。
这些参数通常有特殊的用途。如：我们在编写 C/C++ 代码的时候，在链接的时候，我们从来不知道我们所链接的动态静态库在哪里，但是照样可以链接成功，生成可执行程序，原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途，环境变量在系统当中通常具有全局特性。

1、常见环境变量

PATH：（当前用户）指定命令的搜索路径。
HOME：指定用户的主工作目录（即用户登陆到 Linux 系统中时，默认的目录）。
SHELL：当前 Shell，它的值通常是 /bin/bash。
HISTSIZE：命令历史记录保存数量。（Centos 6.7 默认是 3000 条）

命令 history 可以查看所有命令历史记录。搭配管道 history | wc -l 可以查看命令历史记录的行数。

2、查看环境变量方法

命令：echo $PATH

PATH 是环境变量的名称，查看指定环境变量。

命令：env

查看系统中所有的环境变量。

3、环境变量：PATH

我们编写的 C/C++ 代码，编译生成的可执行程序，是不是一个命令呢？

是的。

在 Linux 中，任何一个可执行程序具有可执行权限（x），就称之为它是一条命令。

其实我们听过的：程序、命令、指令、可执行程序等等都是一个概念。

既然是同一个概念，那为什么运行 ls 等命令，不用带 ./ 当前路径，而运行我们自己的可执行程序 proc 必须要带 ./proc 当前路径呢？

环境变量 PATH 中保存的是指定命令的搜索路径。

因为 ls 等命令是在系统的特定路径下保存起来的，而 proc 命令没有保存在 PATH 指定的这些路径中，系统执行命令又只会在 PATH 指定的这些路径中搜索，那么系统就找不到我们的 proc 命令，所以就报错了。

那有没有什么办法，可以让可执行程序 proc 不用带 ./ 当前路径就可以直接运行呢？

方法 1：把 proc 拷贝到环境变量 PATH 指定的任一路径下。

方法 2：把 proc 所在路径添加到环境变量 PATH 中。（注意：自己添加的环境变量，系统重启后是不会被保存的）
$ PATH=$PATH:/home/ll/xxx/10

# :冒号是分隔符
# 注意：PATH=/home/ll/xxx/10，不能这样写，必须加上$符号，否则会把PATH中所有内容覆盖掉
运行效果图：

注意：如果我们不幸把环境变量给覆盖掉了，不用担心。环境变量既然是变量，说明它是可以被赋值的，即在用户登录时，通过用户目录下的配置文件赋值的，所以只需要重新登录就好了。

比如：在家目录下的 .bash_profile 文件，这些文件不建议自己去随意修改：

4、环境变量：HOME

分别在 root 和普通用户下执行 cd ~ 和 pwd 查看家目录，分别是 /root 和 /home/xyl，为什么得到的结果不一样呢？

因为不同用户的家目录中的配置文件不一样，所以不同用户下的环境变量 HOME 也是不一样的。
[root@VM-0-12-centos ~]$ echo $HOME
/root
[xyl@VM-0-12-centos ~]$ echo $HOME # 指定用户的主工作目录
/home/xyl

二、与环境变量相关的命令

echo：显示某个环境变量值。
export：设置一个新的环境变量。
env：显示所有环境变量。
unset：清除环境变量。
set：显示本地定义的 shell 变量和环境变量。

1、通过 C 库函数获取环境变量：getenv

（1）getenv 和 setenv 函数介绍

name：环境变量的名称。
返回值：环境变量的内容。

#include <stdlib.h>

char *getenv(const char *name); // 获取环境变量
int setenv(const char *name, const char *value, int overwrite); // 更改或添加环境变量

（2）getenv 使用举例

// proc.c
#include <stdio.h>
#include <stdlib.h> // getenv

int main()
{
    printf("%s\n", getenv("PATH"));
    printf("%s\n", getenv("HOME"));
    printf("%s\n", getenv("SHELL"));
    return 0;
}

运行结果：在 bash 创建的子进程 proc 中成功获取到了环境变量。

结论：

我们在命令行上运行的大部分命令，它们的父进程都是 bash。
bash 创建子进程，然后由子进程执行用户输入的命令。

三、环境变量和本地变量

在命令行中，我们通常可以定义两种变量：

环境变量（环境变量通常具有全局属性：可以被子进程继承下去）

环境变量实际上是在当前 bash 的上下文中定义的。所以在当前命令行解释器 bash 内可以被访问到，在 bash 创建的子进程内也可以被访问到。
#include <stdio.h>
#include <stdlib.h>

int main()
{
    char* env = getenv("MYENV");
    if(env)
    {
        printf("%s\n", env);
    }
    return 0;
}
直接运行发现没有结果，说明该环境变量根本不存在。

导出环境变量：export MYENV="hello world"
再次运行程序，发现有结果了。说明：环境变量是可以被子进程继承下去的。

本地变量（只能在当前 shell 命令行解释器内被访问，不可以被子进程继承）

[xyl@VM-0-12-centos 10]$ MY_VAL="hello world"  # 定义本地变量（在bash内定义的）

如何查看本地变量呢？

和查看环境变量方式一样：

[ll@VM-0-12-centos 10]$ echo $MY_VAL  # 在当前命令行解释器bash内访问本地变量
hello world

如何证明本地变量不能被子进程继承？

// proc.c
#include <stdio.h>
#include <stdlib.h> // getenv

int main()
{
    printf("%s\n", getenv("MY_VAL"));
    return 0;
}

运行结果：段错误。

分析：

当我们输入 ./proc 后，bash 会创建子进程来执行 proc 程序。但因为本地变量 MY_VAL 只能在当前 bash 内被访问，不能被其子进程继承，所以子进程中的 getenv("MY_VAL") 函数获取不到本地变量 MY_VAL，导致程序报错。

该怎么解决这个问题呢？

可以将本地变量 MY_VAL 设置成环境变量。

[ll@VM-0-12-centos 10]$ exprot MY_VAL  # 把本地变量MY_VAL导出成环境变量

导入成功：

再次运行程序：成功访问到了环境变量 MY_VAL。

上面说到，我们在命令行上运行的大部分命令，都是 bash 创建子进程来执行的，而本地变量不能被子进程继承，那为什么使用 echo 命令，却可以访问本地变量呢？

四、命令行参数

1、main 函数的参数列表

main 函数可以带参数吗？能带几个参数呢？

main 函数可以带参，但大部分都是缺省。

argc：命令行参数的个数。
argv：字符指针数组（指向各个命令行参数的字符指针所构成的数组）。

int main(int argc, char* argv[]) // 接收命令行参数
{
    for (int i = 0; i < argc; i++)
    {
        printf("argv[%d]: %s\n", i, argv[i]); // 遍历字符指针数组argv
    }
    return 0;
}

运行结果：字符数组中只有一个元素，就是我们输入的命令。

[ll@VM-0-12-centos 10]$ ./proc
argv[0]: ./proc

如果再多输入几个参数，就能观察到如下运行结果：

[ll@VM-0-12-centos 10]$ ./proc agr1 arg2 arg3
argv[0]: ./proc
argv[1]: agr1
argv[2]: arg2
argv[3]: arg3

总结：

实际上我们输入的命令行参数，就是一个个的 C 字符串： "./proc"、"arg1"、"arg2"、"arg3"，传给了 main 函数：

2、命令行参数的意义

为什么要存在命令行参数呢?

帮助我们能够给同一个程序，设计出不同的业务功能。

举个小例子，比如我想要实现这样一个计算器：

如果输入 ./cal，则会提示该程序的正确用法：Usage：./cal -[a|s] x y;

输入 ./cal -a 1 2，cal 程序可以输出 1 + 2 的结果；

输入 ./cal -s 4 2，cal 程序可以输出 4 - 2 的结果。

#include <stdio.h>
#include <stdlib.h> // atoi -- 函数原型：int atoi(const char *nptr); // 将C字符串转换成整数
#include <string.h> // strcmp

// cal命令的用法手册
void Usage(const char* cal)
{
    printf("Usage: %s -[a|s] x y\n", cal);
}

int main(int argc, char* argv[]) // 接收命令行参数
{
    // 输入的参数个数不为4
    if (argc != 4)
    {
        Usage(argv[0]);
        return 1; // 退出程序
    }

    // 保存第3个和第4个参数                                                      
    int x = atoi(argv[2]);
    int y = atoi(argv[3]);
    
    // 根据不同参数，执行不同功能，然后输出结果
    if (strcmp(argv[1], "-a") == 0)
    {                                            
        printf("%d + %d = %d\n", x, y, x + y); 
    }
    else if (strcmp(argv[1], "-s") == 0)
    {
        printf("%d - %d = %d\n", x, y, x - y); 
    }
    else
    {
        Usage(argv[0]);
        return 1; // 退出程序
    }

    return 0;
}

运行结果：

[ll@VM-0-12-centos 10]$ ./cal        # 命令使用手册
Usage: ./cal -[a|s] x y
[ll@VM-0-12-centos 10]$ ./cal -a 1 2 # 实现加法
1 + 2 = 3
[ll@VM-0-12-centos 10]$ ./cal -s 4 2 # 实现减法
4 - 2 = 2

3、总结

命令行参数可以让同一个命令，通过带上不同的选项表现出不同的功能和作用。

比如：ls -l、ls -l -a、ls -l -a -i。这就是命令行参数的意义。

我们平常在 VS 中写代码，都知道程序是从 main 函数开始执行，那是谁调用的 main 函数呢？

编程者写的 main 函数被 void mainCRTStartup(void) 函数调用的，这个函数定义在 VS 安装目录的某个 .c 文件中（VS 的版本不同，存放的位置也不同），它会执行一些初始化操作，如从内核中获取命令行参数和环境变量值、初始化全局变量、初始化 IO 等等所需各项准备之后，为调用 main(argc, argv, env) 函数做好了准备。
可以通过 main 函数的参数，可以传递命令行参数和环境变量。

五、环境变量的组织方式

main 函数除了可以传递两个和命令行参数相关的参数 argc 和 argv 以外，还可以传递第 3 个参数 env：

int main(int argc, char* argv[], char* env[]);

这也是 main 函数获取环境变量的方式。

通过给 main 函数第三个参数传参，把一个个环境变量传递给当前程序，当前程序运行起来变成进程，就意味着当前这个进程获取到了这些环境变量。

每个被 bash 创建的子进程都会接收到一张环境表，环境表是一个字符指针数组，每个指针指向一个以 ’\0’ 结尾的环境字符串（环境变量）。

1、通过 main 的第三个参数获取环境变量

// proc.c
#include <stdio.h>
#include <string.h>

int main(int argc, char* argv[], char* env[]) // 通过第三个参数接收环境变量
{
    for (int i = 0; env[i]; i++) // 循环结束条件为env[i]，遍历到NULL停止
    {
        printf("env[%d]: %s\n", i, env[i]); // 遍历字符指针数组env
    }
    return 0;
}

运行结果：获取到了当前 bash 内的所有环境变量。（因为环境变量被 bash 创建的子进程 proc 继承下去了）

所以现在知道 C 库函数 getenv 的实现原理了，比如 printf("%s\n", getenv("PATH"));，其实就是通过在字符指针数组 env 中进行字符匹配，找到 "PATH" 后面的内容并返回。

2、通过全局变量 environ 获取环境变量（了解）

C/C++ 提供了一个全局二级指针变量 char** environ，指向存放环境变量地址的字符指针数组 char* env[ ]。

#include <stdio.h>

int main()
{
    extern char** environ;
    for (int i = 0; environ[i]; i++)
    {
        printf("%s\n", environ[i]); // 等价于 *(environ + i)
    }
    return 0;
}

注意：因为 libc 中定义的全局变量 environ 指向环境变量表，environ 没有包含在任何头文件中，所以在使用时要用 extern 声明。

下面程序运行会报错吗？

不会。

#include <stdio.h>

void show()
{
    printf("hello show\n");
}

int main()
{
    show(10, 20);
    return 0;
}

分析：10 和 20 这两个参数是传给了 show 函数，它们被压入了 show 函数栈帧中，实际上在 show 函数中是可以通过某些指针操作来获取到 10 和 20 的，只是比较复杂。

上述程序中的二级指针 environ 可以通过某种方式在 main 的压栈结构中指向传入的命令行参数 char* env[ ]（环境变量表），来获取到环境变量。