【Linux取经路】探寻shell的实现原理

news2025/1/23 10:37:22

在这里插入图片描述

文章目录

  • 一、打印命令行提示符
  • 二、读取键盘输入的指令
  • 三、指令切割
  • 四、普通命令的执行
  • 五、内建指令执行
    • 5.1 cd指令
    • 5.2 export指令
    • 5.3 echo指令
  • 六、结语

一、打印命令行提示符

const char* getusername() // 获取用户名
{
    return getenv("USER");
}

const char* gethostname() // 获取主机名
{
    return getenv("HOSTNAME");
}

const char* getpwd() // 获取当前所处的目录
{
    char* pos = strrchr(getenv("PWD"), '/'); // 查找最后一个 ‘/’ 
    if(*(pos+1) != '\0') return pos+1; // 说明不是根目录,返回最后一个文件夹
    return pos;
}

void tooltip() // 打印命令行提示框
{
    printf(LEFT "%s@%s %s" RIGHT PROMPT" ", getusername(), gethostname(), getpwd());
}

在这里插入图片描述
代码分析:获取基础信息本质上是通过调用 getenv 接口来获取对应环境变量的值。借助 strrchr 函数来查找当前路径中的最后一个文件分隔符 /,它有可能是文件分隔符也有可能是根目录因此要单独判断。

二、读取键盘输入的指令

char command[1024]; // 存储键盘输入的指令

int getcommand(char* command, int size) // 读取指令
{
    memset(command, '\0', size);
    char* ret = fgets(command, size, stdin); // 这里 ret 一定不为空,因为至少会输入一个回车,fgets 可以读取回车
    assert(ret != NULL);
    (void)ret;// “假装使用一下ret,防止有些编译器警告”
    // aaabc\n\0
    command[strlen(command)-1] = '\0'; // 去掉结尾的 \n
    return 1;
}

int interact(char* command, int size) // 交互
{
    tooltip();
    while(getcommand(command, size) && (strlen(command) == 0))
    {
        tooltip();
    }
}

int main()
{
    interact(command, sizeof(command)); // 交互
    printf("echo: %s\n", command);
    return 0;
}

在这里插入图片描述
代码分析:键盘输入的指令本质上就是一串字符串,这里不能用 scanf 来获取字符串,因为 scanf 是不会读取空格和回车的(遇到空格和回车就停止读取),而我们一般的指令都是带选项的,指令和选项之间一般会用空格隔开,用 scanf 会导致我们指令读不全。这里使用 fgets 函数来读取键盘输入,其第一参数是存储指令的空间的首地址;第二个参数是空间的大小;第三个参数是从哪个文件流中读取,一个 C/C++ 程序默认会打开三个文件流 stdinstdoutstderr,这里选择从 stdin 中读取,也就是从标准输入中读取。gets 函数会在结尾自动帮我们添加 \0,并且当读取的字符个数大于存储容量时,该函数会自动在结尾放 \0,因此我们可以不用考虑为 \0 预留空间或者认为的在字符串结尾加 \0。其次该函数读取成功返回 command 的首地址,否则返回 NULL,在当前场景下,除非读取错误,否则至少都会读入一个 \n,一般我们输入完指令就是敲回车,什么指令不输也敲回车,因此正常情况下 ret 不可能为 NULL。这里还要考虑删除掉读取到的 \n,因为我们不需要它,我们只要完整的指令。

三、指令切割

#define SEPARATOR " " // 指令分隔符
char* argv[ARGC_LONG] = {NULL}; // 存储指令和选项的起始地址

void commandcut(char* command, char** argv, int argvsize) // 指令切割
{
    memset(argv, 0, argvsize); // 清空
    char cop_command[COMMAND_LONG] = {'\0'}; // 保证 command 串不被改变
    for(int i = 0; command[i] != '\0'; i++)
    {
        cop_command[i] = command[i];
    }
    // 开始切割子串
    char* ret = strtok(cop_command, SEPARATOR);
    int i = 0;
    while(ret != NULL)
    {
        argv[i++] = ret;
        ret = strtok(NULL, " ");
    }
}

int main()
{
    while(1)
    {
        // 1、交互获取命令行参数
        interact(command, sizeof(command)); // 交互

        // 到这里说明指令已经获取到了,接下来将指令打散
        // 2、指令切割
        commandcut(command, argv, sizeof(argv));
        for(int i = 0; argv[i]; i++)
        {
            printf("[%d]: %s\n", i, argv[i]);
        }
        printf("echo: %s\n", command);
    }
    return 0;
}

在这里插入图片描述

代码分析:这一步主要是借助 strtok 函数将获取到的指令切割成一个一个的子串,将所有子串的起始地址存储在 argv 里面。注意 strtok 函数会改变原空间的内容,因此创建了一段临时的空间 cop_command

四、普通命令的执行

void normalcommandexecution(char** _argv, int* _lastcode) // 普通命令的执行
{
    pid_t id = fork();
    if(id < 0)
    {
        perror("fork");
    }
    else if(id == 0)
    {
        // child
        int ret = execvp(_argv[0], _argv);
        if(ret == -1)
        {
            perror("exeecp");
            exit(EXIT_CODE);
        }
    }
    else
    {
        // father
        int status;
        pid_t ret = waitpid(id, &status, 0); // 阻塞等待
        if(ret == id)
        {
            *_lastcode = WEXITSTATUS(status);
        }
    }
}

int main()
{
    while(1)
    {
        // 1、交互获取命令行参数
        interact(command, sizeof(command)); // 交互

        // 到这里说明指令已经获取到了,接下来将指令打散
        // 2、指令切割
        commandcut(command, argv, sizeof(argv));
        
        // 3、普通命令执行
        normalcommandexecution(argv, &lastcode);
    }
    return 0;
}

在这里插入图片描述
代码分析:对于 ls 这种普通指令(非内建指令),先通过 fork 创建子进程,然后再调用 execvp 接口进行程序替换,去执行输入的指令。

五、内建指令执行

5.1 cd指令

bool isnormalcommand(char **_argv) // 指令判断
{
    if (strcmp(_argv[0], "cd") == 0)
        return false;

    return true;
}

void changpwd(char** _argv) // 更改当前工作目录
{
    chdir(_argv[1]); // 更改当前工作目录
    // getpwd(pwd, sizeof(pwd));
    sprintf(getenv("PWD"), "%s", getcwd(pwd, sizeof(pwd))); // 修改环境变量
}

void builtincommand(char **_argv) // 内建命令执行
{
    if (strcmp(_argv[0], "cd") == 0)
    {
        changpwd(_argv);
    }
}

int main()
{
    while (1)
    {
        // 1、交互获取命令行参数
        interact(command, sizeof(command)); // 交互

        // 到这里说明指令已经获取到了,接下来将指令打散
        // 2、指令切割
        commandcut(command, argv, sizeof(argv));

        // 3、指令判断

        // 3、普通命令执行
        if (isnormalcommand(argv)) // 普通指令
            normalcommandexecution(argv, &lastcode);
        else // 内建指令
            builtincommand(argv);
    }
    return 0;
}

在这里插入图片描述

代码分析:要考虑内建指令,那在指令切割之后要先对指令进行判断。内建指令不需要创建子进程去执行,而是直接由当前的 bash 进程去执行。比如说 cd 指令,执行完 cd 指令后,我们要让当前的 bash 更改工作目录,而不是让其创建子进程去执行 cd 指令,那样改变的就是子进程的工作目录。可以发现,一个指令执行完后,如果会对 bash 产生影响,那么它就必须是内建指令。其次关于 cd 指令,它改变了当前的工作目录,这一点该如何理解呢?我 myshell 就是一个可执行程序,我的源代码和编译得到的可执行文件始终都放在 /home/wcy/linux-s/2023-10-28a/myshell 目录下,你 cd 命令凭什么能改变我的工作目录?其实并不然,这里改变工作目录是:一个可执行程序在变成进程产生 PCB 对象后,PCB 里面维护了一个属性就叫做当前可执行程序的工作目录,cd 指令改变的其实就是这一属性,并不是改变 myshell 程序的存储位置,我们通过调用 chdir 系统调用来修改这一属性。最后,因为我们前面是通过环境变量来获取当前工作目录,而环境变量在被当前 myshell 进程从父进程继承下来后是不会自动发生改变的,因此在执行完 cd 指令后,我们要对 PWD 环境变量进行修改,环境变量本质上就是存储在内存中的一段字符串信息,因此我们可以采用 sprintf 函数对该字符串信息进行修改。

在这里插入图片描述

5.2 export指令

#define USER_ENV_SIZE 100  // 允许用户添加的环境变量个数
#define USER_ENV_LONG 1024 // 用户一个环境变量的最大长度

char userenv[USER_ENV_SIZE][USER_ENV_LONG]; // 保存用户添加的环境变量
int userenvnum = 0;                         // 当前用户输入的环境变量个数

void exportcommand(char** _argv, char(*_userenv)[USER_ENV_LONG], int* _userenvnum)
{
    // 将用户输入的环境变量存储起来
    strcpy(_userenv[*_userenvnum], _argv[1]);
    int ret = putenv(_userenv[(*_userenvnum)++]);
    if (ret == 0)
        perror("putenv");
}

在这里插入图片描述
代码分析:只要 bash 不退出,我们每次添加的环境变量都应该被保存起来,我们输入的环境变量是被当做指令保存在 command 里面,当下一次输入指令,上一次输入的内容就会被清空。putenv 添加环境变量,并不是把对应的字符串拷贝到系统的表当中,而是把该字符串的地址保存在系统的表中,因此我们要确保保存环境变量字符串的那个地址里的环境变量不会被修改,所以我们需要为用户输入的环境变量,也就是那一串字符串单独开辟一块空间进行存储,保证在内次重新输入指令的时候,不会影响到之前用户添加的环境变量。因为环境变量本质就是一个字符串,所以这里我们定义了一个字符二维数组来存储用户输入的环境变量,先把用户输入的环境变量存入我们定义的这个数组,然后再调用 putenv 函数将数组中的内容添加到当前的环境变量。这样就可以保证只要当前 bash 不退出,用户历史上添加的环境变量都在。这里涉及到二维数组传参的问题,再来回顾一下,数组名表示首元素地址,二维数组的首元素是一个一维数组,所以函数形参的类型是一个字符一维数组的地址,也就是 char(*)[USER_ENV_LONG]

5.3 echo指令

void echocommand(char **_argv, int _argc)
{
    if (_argv[1][0] == '$')
    {
        char *ptr = _argv[1] + 1;
        printf("%s\n", getenv(ptr));
    }
    else
    {
        int i = 1;
        while (i < _argc)
        {
            char *ret = strtok(_argv[i], "\"");
            while (ret != NULL)
            {
                printf("%s", ret);
                ret = strtok(NULL, "\"");
            }
            printf("%c", ' ');
            i++;
        }
        printf("\n");
    }
}

在这里插入图片描述
代码分析echo 指令需要考虑将输入的 " 去掉,其次可能连续输入多个字符串,还要考虑 echo$ 配合使用是去打印环境变量的值。

小结:当我们登陆的时候,系统就是要启动一个 shell 进程,我们 shell 本身的环境变量是在用户登录的时候,shell 会读取用户目录下的 .bash_profile 文件,里面保存了导入环境变量的方式。

在这里插入图片描述
在这里插入图片描述

六、结语

今天的分享到这里就结束啦!如果觉得文章还不错的话,可以三连支持一下,春人的主页还有很多有趣的文章,欢迎小伙伴们前去点评,您的支持就是春人前进的动力!

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1437980.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

生成式学习,特别是生成对抗网络(GANs),存在哪些优点和缺点,在使用时需要注意哪些注意事项?

生成对抗网络&#xff08;GANs&#xff09; 1. 生成对抗网络&#xff08;GANs&#xff09;的优点&#xff1a;2. 生成对抗网络&#xff08;GANs&#xff09;的缺点&#xff1a;3. 使用生成对抗网络&#xff08;GANs&#xff09;需要注意的问题 1. 生成对抗网络&#xff08;GANs…

学生管理系统(javaSE第一阶段项目)

JavaSE第一阶段项目_学生管理系统 1.项目介绍 此项目是JavaSE第一阶段的项目,主要完成学生对象在数组中的增删改查,大家可以在此项目中发挥自己的想象力做完善,添加其他功能等操作,但是重点仍然是咱们前9个模块的知识点2.项目展示 2.1.添加功能 2.2.查看功能 2.3.修改功能 2…

第二证券:大涨5%,这一指数爆发!

A股商场今日上午进一步上行&#xff0c;各大指数持续上涨&#xff0c;其间上证指数克复2800点。小市值股票体现更佳&#xff0c;中证1000指数上午大涨5%。 港股商场方面&#xff0c;今日上午一度大幅上涨&#xff0c;后涨幅有所回落。港股百胜我国今日上午体现抢眼&#xff0c…

jvm垃圾收集器之七种武器

1.回收算法 1.1 标记-清除算法(Mark-Sweep) 分为两个阶段&#xff0c;标注和清除。标记阶段标记出所有需要回收的对象&#xff0c;清除阶段回收被标记的对象所占用的空间。 该算法最大的问题是内存碎片化严重&#xff0c;后续可能发生大对象不能找到可利用空间的问题。 1.2 …

10.0 Zookeeper 权限控制 ACL

zookeeper 的 ACL&#xff08;Access Control List&#xff0c;访问控制表&#xff09;权限在生产环境是特别重要的&#xff0c;所以本章节特别介绍一下。 ACL 权限可以针对节点设置相关读写等权限&#xff0c;保障数据安全性。 permissions 可以指定不同的权限范围及角色。 …

Topaz Photo AI for Mac v2.3.1 补丁版人工智能降噪软件无损放大

想要将模糊的图片变得更加清晰&#xff1f;不妨试试Topaz Photo AI for Mac 这款人工智能、无损放大软件。Topaz Photo AI for Mac 一款强大的人工智能降噪软件&#xff0c;允许用户使用复杂的锐化算法来提高图像清晰度&#xff0c;还包括肖像编辑选项&#xff0c;如面部重塑、…

Verilog刷题笔记20

题目&#xff1a; Case statements in Verilog are nearly equivalent to a sequence of if-elseif-else that compares one expression to a list of others. Its syntax and functionality differs from the switch statement in C. 解题&#xff1a; module top_module ( …

RabbitMQ-3.发送者的可靠性

发送者的可靠性 3.发送者的可靠性3.1.生产者重试机制3.2.生产者确认机制3.3.实现生产者确认3.3.1.开启生产者确认3.3.2.定义ReturnCallback3.3.3.定义ConfirmCallback 3.发送者的可靠性 首先&#xff0c;我们一起分析一下消息丢失的可能性有哪些。 消息从发送者发送消息&#…

新版MQL语言程序设计:键盘快捷键交易的设计与实现

文章目录 一、什么是快捷键交易二、使用快捷键交易的好处三、键盘快捷键交易程序设计思路四、键盘快捷键交易程序具体实现1.界面设计2.键盘交易事件机制的代码实现 一、什么是快捷键交易 操盘中按快捷键交易是指在股票或期货交易中&#xff0c;通过使用快捷键来进行交易操作的…

L1-071 前世档案

一、题目 二、解题思路 三、代码 #include<iostream> using namespace std; #include<cmath> int main() {int n,m;cin>>n>>m;while(m--){string str;cin>>str;int x1;for(int i0;i<n;i){if(str[i]n){xpow(2,n-(i1));}}cout<<x<<…

Linux网络配置及进程管理

一、网络配置 1、网络配置原理图 2、查看网络IP和网关 3、查看windows环境的中VMnet8网络配置&#xff08;ipconfig 指令&#xff09; 4、查看Linux网络配置&#xff08;ifconfig指令&#xff09; 5、Linux网络环境配置 5.1、自动获取 5.2、指定IP 直接修改配置文件来制定IP…

阿里云游戏服务器收费价格表,一年和1个月报价

阿里云游戏服务器租用价格表&#xff1a;4核16G服务器26元1个月、146元半年&#xff0c;游戏专业服务器8核32G配置90元一个月、271元3个月&#xff0c;阿里云服务器网aliyunfuwuqi.com分享阿里云游戏专用服务器详细配置和精准报价&#xff1a; 阿里云游戏服务器租用价格表 阿…

Tomcat之虚拟主机

1.创建存放网页的目录 mkdir -p /web/{a,b} 2.添加jsp文件 vi /web/a/index.jsp <% page language"java" import"java.util.*" pageEncoding"UTF-8"%> <html> <head><title>JSP a page</title> </head> …

IAR报错:Error[Pa045]: function “halUartInit“ has no prototype

在IAR工程.c文件末尾添加一个自己的函数&#xff0c;出现了报错Error[Pa045]: function "halUartInit" has no prototype 意思是没有在开头添加函数声明&#xff0c;即void halUartInit(void); 这个问题我们在keil中不会遇到&#xff0c;这是因为IAR编译器规则的一…

堆结构的解读

对于数据结构堆来说,堆事一种特定的数据结构,其与二叉树非常类似,但是又与二叉树有所不同,其不同点在于堆不需要左右指针指向孩子节点,而给定一个数组,将数组中的元素进行特定排序之后,就可以得到一个堆,如图是一个数组 添加图片注释,不超过 140 字(可选) 该数组的…

鸿蒙开发系列教程(十四)--组件导航:Tabs 导航

Tabs 导航 Tabs组件的页面组成包含两个部分&#xff0c;分别是TabContent和TabBar。TabContent是内容页&#xff0c;TabBar是导航页签栏 每一个TabContent对应的内容需要有一个页签&#xff0c;可以通过TabContent的tabBar属性进行配置 设置多个内容时&#xff0c;需在Tabs…

牛客网SQL:查询每个日期新用户的次日留存率

官网链接&#xff1a; 牛客每个人最近的登录日期(五)_牛客题霸_牛客网牛客每天有很多人登录&#xff0c;请你统计一下牛客每个日期新用户的次日留存率。 有一个登录(login。题目来自【牛客题霸】https://www.nowcoder.com/practice/ea0c56cd700344b590182aad03cc61b8?tpId82 …

为什么Mac电脑需要装系统优化清理软件?

为什么Mac电脑需要装系统优化清理软件? 依照我个人多年使用Mac 的经验&#xff0c;Mac 系统用起来比起Windows 系统稳定不少&#xff0c;软件性能也优化得很好 &#xff0c;并且不容易中毒。 但我 还是推荐大家在你的Mac 上装一套系统优化、清理软件 。 接下来就以垃圾文件、中…

玩转Java8新特性

背景 说到Java8新特性&#xff0c;大家可能都耳濡目染了&#xff0c;代码中经常使用遍历stream流用到不同的api了&#xff0c;但是大家有没有想过自己也自定义个函数式接口呢&#xff0c;目前Java8自带的四个函数式接口&#xff0c;比如Function、Supplier等 stream流中也使用…

forecast-mae调试代码报错记录2个:

微调命令python3 train.py data_root/path/to/data_root modelmodel_forecast gpus4 batch_size32 monitorval_minFDE pretrained_weights"/path/to/pretrain_ckpt"中的两个错误。 问题1&#xff1a; pretrained_weights不需要加单引号&#xff0c;单引号 去掉。 问…