文章目录
- 一、硬件-冯诺依曼体系结构
- 二、软件-操作系统-进程概念
- 0.操作系统做什么的
- 1.什么叫做进程
- 2.查看进程
- 3.系统接口 获取进程pid- getpid
- 4.系统接口 获取父进程pid - getppid
- 5.系统接口 创建子进程 - fork
- 1、手册
- 2、返回值
- 3、fork做了什么
- 4、基本用法
- 6.进程的状态
- 1、进程的状态是什么
- 2、进程的状态
- 7.Linux下的进程状态
- 1、运行状态 - R
- 2、阻塞状态 - S (可中断)
- 3、阻塞状态 - D (不可中断)
- 4、僵尸状态- Z 和 死亡状态 - X
- 5.停止状态 - T / t
- 8.孤儿进程
- 9.进程优先级
- 1、什么是优先级 vs 权限 (是什么)
- 2、为何会存在优先级?(为什么)
- 3、Linux下的优先级的相关概念和操作(怎么办)
- 10.竞争性_独立性_并行_并发_进程间切换
- 三、环境变量
- 1.环境变量操作
- 2.让自己程序和命令一样执行
- 3.常见环境命令
- 4.环境变量的C、C++获取方式(代码如何获取环境变量)
- 1、mian函数参数获取环境变量
- 2、通过C语言提供的全局变量获取 - environ
- 3、获取环境变量函数 - getenv(const char* name)
一、硬件-冯诺依曼体系结构
我们常见的计算机,如笔记本。我们不常见的计算机,如服务器,大部分都遵守冯诺依曼体系。
输入:键盘,话筒,摄像机,磁盘,网卡…
输出:显卡,音响,磁盘,网卡,显卡…
(运算器+控制器)[cpu]:算术计算+逻辑计算
储存器:就是内存
为什么要有内存,直接将输入设备和cpu直接连接不可以吗?
a. 技术角度
cpu的运算速度>寄存器的速度>L1~L3Cache>内存>>外设(磁盘)>>光盘磁带
数据角度:外设不和CPU直接交互,而是和内存交互,CPU也是如此。
内存在我们看来,就是体系结构的一个大的缓存,适配外设和CPU速度不均的问题的!
b. 成本角度
造价成本:寄存器>>内存>>磁盘(外设)
几乎所有的硬件,只能被动的完成某种可能,不能主动的完成某种功能,一般都是配合软件完成的(OS+CPU)
二、软件-操作系统-进程概念
0.操作系统做什么的
操作系统是一款软件,搞管理的软件,什么叫做管理, 如何理解?
管理的本质:不是对被管理对象进行直接管理,而是只要拿到被管理对象的所有的相关数据,我们对数据的管理,就可以体现对人的管理————对数据做管理
数据是有多少的区分的如何管理好大量数据?
大量数据,就需要结构化,也就是对数据结构的管理。
管理的核心理念:先描述,再组织
1.什么叫做进程
进程是一个运行起来的程序
操作系统里面可能同时存在大量的进程!操作系统需要对进程管理,对进程管理本质就是对进程数据的管理,就需要先描述,再组织。
struct task_struct : 就是描述进程的,像这样描述进程的统称为进程控制块PCB( proccess ctrl block ),而task_struct就是其中一个具体实例。
进程 = 可执行程序 + 该进程对应的内核数据结构(PCB)
OS为什么给我们提供服务?
printf 向显示器打印,本质就是将数据写到硬件上,我们的c程序没有资格向硬件写入,计算机和os设计出来是为了给人提供服务的。
如何提供服务?
操作系统不相信如何人!不会直接暴露自己的任何数据结构,代码逻辑,其他数据相关的细节!!操作系统是通过系统调用的方式,对外提供接口服务的,Linux操作系统是用c语言写的,这里所谓的“接口”,本质就是c函数!我们学习系统编程—本质就是在学习这里的系统接口
2.查看进程
先写一个死循环程序编译运行:
#include<stdio.h>
int main()
{
while(1)
{
printf("I am a process!\n");
}
return 0;
}
查看进程方式1:
这是查看进程的第一种方式,也是最常用的。
ps ajx 进程名 | grep 进程名
有头部提示:
ps ajx |head -1 && grep 进程名称
为什么会有两个?
我们自己写的代码,编译称为可执行程序,启动之后就是一个进程!
别人写的,启动之后也是一个进程!比如:ls pwd touch grep …
那么这些程序,在系统中的位置— /usr/bin
第二个进程就是查询程序的进程,第一个就是我们编写的程序的进程。
根目录里有一个目录proc,放内存文件系统,系统里放着当前系统实时的进程信息。查看目录里面的内容:
上面的蓝色就是进程的pid!
每一个进程在系统中,都会存在一个唯一的标识符(pid->process id)!就如每人都有一个身份证号。
查看运行进程目录其中有一个cwd:
cwd :current work directory 进程当前工作路径
当前路径??
当前进程所在路径,进程自己会维护
查看进程的方式2:
先查进程pid在再/proc里的进程目录查看详细信息。
那么上面所说的pid,当前路径等待,是进程的内部属性,程序运行放在哪里?
进程的进程控制块-PCB(task_struct)结构体中
3.系统接口 获取进程pid- getpid
命令行查看系统接口getpid:
man 2 getpid
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
printf("我的pid是 %d\n",getpid());
return 0;
}
杀进程除了Ctrl+c还有一个方法:
另起一个页面,命令行输入kill -9 进程的pid
4.系统接口 获取父进程pid - getppid
命令行查看系统接口getppid:
man 2 getppid
注:
手册退出按q
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
printf("我的pid是 %d,ppid: %d\n",getpid(),getppid());
return 0;
}
多次运行发现ppid不变
查看进程,发现父进程是一个bash:
为什么父进程不变?它是谁?
几乎我们在命令行上执行的所有的指令(你的cmd),都是bash进程的子进程!
5.系统接口 创建子进程 - fork
1、手册
man 2 fork
2、返回值
下面为手册中返回值解释:
fork函数是用来创建子进程的,它有两个返回值?
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
pid_t id = fork();
printf("hello world,id: %d\n",id);
return 0;
}
父进程返回子进程pid,子进程返回0
同一个id值,使用打印,没有修改,却打出来了不同的值?
现在无法解释,进程地址空间,才能解释!
c语言上,if和else 可以同时执行吗?
c语言中,有没有可能两个以上的死循环同时运行?
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
pid_t id = fork();
if(id==0)
{
while(1)
{
printf("我是子进程,我的pid:%d,我的父进程是:%d\n",getpid(),getppid());
sleep(1);
}
}
else
{
while(1)
{
printf("我是父进程,我的pid:%d,我的父进程是:%d\n",getpid(),getppid());
sleep(1);
}
}
printf("hello world,id: %d\n",id);
return 0;
}
为什么 fork 给父进程子进程的pid,给子进程 0?
父亲:儿子 = 1:n (n>=1)
为什么给父进程子进程的pid
父进程必须有标识子进程的方案,fork之后,给父进程返回子进程的pid!
为什么给子进程0?
子进程最重要的是要知道自己被创建成功了,因为子进程找父进程成本非常低getppid()
综上得出结论:
fork之后,父进程和子进程会共享代码,一般都会执行后续代码 — printf为什么会打印两次的问题
fork之后,父进程和子进程返回值不同,可以通过不同的返回值来判断,让父子执行不同的代码块!!
3、fork做了什么
fork之后,OS做了什么?
系统多了一个进程:
父进程:task_struct + 进程代码和数据
子进程:task_struct + 子进程的代码和数据
子进程的tastk_struct对象内部数据从哪里来?
基本是从父进程继承下来的
子进程执行代码,计算数据,子进程的代码从哪里来?
和父进程执行同样的代码,fork之后,父子进程代码共享,而数据要各自独立,根据不同的返回值,让不同的进程执行不同的代码(可以用if else 来分流)。
4、基本用法
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
int main()
{
pid_t id = fork();
if(id==0)
{
//子进程执行的代码
}
else
{
//父进程执行的代码
}
return 0;
}
6.进程的状态
1、进程的状态是什么
其实就是个整数 ,int status,在进程的task_struct(进程控制块)里。
int status:
#define RUN 1
#define STOP 2
#define SLEEP 3
2、进程的状态
运行态:进程只要是在运行队列中就叫做运行态,代表我已经准备好了,随时可以调度!!
注:runqueue就是运行队里
终止状态:进程还在,只不过永远不运行了,随时等待被释放!
进程都终止了,为什么不立马释放对应的资源,而是维护一个终止态?
释放要花时间,如果当前系统很忙,系统就没有办法立刻释放,就需要维护一个终止队列,告诉系统,我已经运行结束了,随时可以释放对应的资源,等到系统有空闲的时来释放我吧!
进程阻塞:进程等待某种资源(非CPU)资源没有就绪的时候,进程需要在该资源的等待队列中进行排队,此时进程的代码并没有运行,进程所处的状态就叫做阻塞!
1.一个进程,使用资源的时候,可不仅仅是申请CPU资源
2.进程可能申请更多的其他资源:磁盘,网卡,显卡,显示器资源,声卡/音响
如果申请CPU资源,暂时无法得到满足,需要排队的–运行队列
那么如果申请其他慢设备的资源?—也是需要排队的!
当访问某些资源(磁盘网卡),该资源如果没有准备好,或者正在给其他进程提供服务,此时:
1.当前进程从runqueue中移除
2.将当前进程放入对应设备的描述结构体中的等待队列
进程等待外部资源的时候,该进程的代码不会被执行,也就是我的进程卡住了就是进程阻塞
进程挂起:短期内不会被调度(你等的资源,短期内不会就绪)进程,OS就会把该进程的代码和数据置换到磁盘上
如果内存不足怎么办?
操作系统就会帮我们进行辗转腾挪,短期内不会被调度(你等的资源,短期内不会就绪)进程,它的代码和数据依旧在内存中,就是白白浪费空间,OS就会把该进程的代码和数据置换到磁盘上!
往往内存不足的时候,伴随
7.Linux下的进程状态
Linux内核源码:
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
1、运行状态 - R
#include<stdio.h>
#include<unistd.h>
int main()
{
while(1)
{
printf("hello wordl!\n");
sleep(1);
}
return 0;
}
运行并查看进程:
虽然进程一直在执行,但大部分都在sleep.
#include<stdio.h>
#include<unistd.h>
int main()
{
while(1)
{
printf("hello wordl!\n");
// sleep(1);
}
return 0;
}
运行并查看进程:
原因是这一句 printf(“hello wordl!\n”);,进程大部分时间在等显示器就绪,就绪就打印。
2、阻塞状态 - S (可中断)
“S (sleeping)” 阻塞状态
一般把S状态叫做:浅度睡眠,可中断睡眠
#include<stdio.h>
#include<unistd.h>
int main()
{
while(1)
{
}
return 0;
}
运行并查看进程:
这个进程没有访问外设,在访问cpu资源,大概率就是R状态。
“R (running)” 运行态
3、阻塞状态 - D (不可中断)
D (disk sleep)" 阻塞态
D : 深度睡眠,不可被中断睡眠
一般而言,Liunx中,如果我们等待的是磁盘资源,进程阻塞所处的状态就是D。(此时进程在等待外设,切程序不可被中断,如果可以中断,磁盘写入失败,磁盘会把写入失败结果告诉进程时,发现进程已经没了,就会造成数据)
4、僵尸状态- Z 和 死亡状态 - X
X:死亡状态
Z(zombie):僵尸状态
当一个Linux中的进程退出的时候,一般不会进入X状态(死亡,资源可以立马回收),而是进入Z状态。
进程为什么被创建出来?
一定是因为要有任务让这个进程执行,当该进程退出的时候,我们怎么知道,这个进程把任务给我们完成的如何了呢??一般需要将进程的执行结构告诉给父进程 OS
进程进入Z状态,就是为了维护退出信息,可以让父进程或者OS读取的!通过进程等待来进行读取的!
如何模拟僵尸状态?
如果创建子进程,子进程退出了,父进程不退出,也不等待子进程,子进程退出之后所处的状态就是Z。
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
pid_t id = fork();
if(id==0)
{
//child
int cnt = 5;
while(cnt)
{
printf("我是子进程,我还剩下%d s\n",cnt--);
sleep(1);
}
exit(0);
}
else
{
//father
while(1)
{
sleep(1);
}
}
return 0;
}
编译运行并查看进程:
while :; do ps axj|head -1&&ps axj|grep test|grep -v grep;sleep 1; don
长时间僵尸,有什么问题?
如果没有人回收子进程的僵尸,该状态会一直维护!该进程的相关资源(task_struct)不会被释放,内存泄漏!一般必须要求父进程进行回收(后面说)。
5.停止状态 - T / t
将进程暂停:
方法一:
运行程序,按Ctrl+z。
方法二:
发送暂停信号给进程
kill -19 pid
t状态用gdb调试进程,就会出现t状态。
8.孤儿进程
#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
pid_t id = fork();
if(id==0)
{
//child
int cnt = 5;
while(cnt)
{
printf("我是子进程,我还剩下%d s\n",cnt--);
sleep(1);
}
exit(0);
}
else
{
//father
while(1)
{
int cnt = 3;
while(cnt)
{
printf("我是父进程,我还剩下%d s\n",cnt--);
sleep(1);
}
exit(0);
}
}
return 0;
}
上面现象:
前三秒,父进程还没退出,当父进程退出后,子进程的父进程变成了1号进程,再过两秒,子进程退出,被1号进程回收。
结论:
如果父进程提前退出,子进程还在运行,子进程会被1号进程(操作系统)领养,像这样被领养的进程,就叫做孤儿进程。
子进程状态从S+变成S表示什么?
带+号的表示前台进程,可以使用Ctrl+c来杀掉前台进程。
但后台进程就无法用Ctrl+c来杀掉,只能用发送信号来杀掉进程:
kill -9 后台进程的pid
9.进程优先级
1、什么是优先级 vs 权限 (是什么)
优先级是进程获取资源的先后顺序。
权限是能还是不能的问题。
2、为何会存在优先级?(为什么)
排队的本质叫做确定优先级,那为什么要排队------资源不够
系统里面永远都是,进程占大多数,而资源是少数,进程竞争资源是常态,有竞争就需要确认先后,所以要存在优先级。
3、Linux下的优先级的相关概念和操作(怎么办)
查看进程:
ps -al
优先级由两部分构成:
PRI:priority
NI :nice 进程优先级的修改数据
默认进程优先级是80,数字越小优先级越高
要更改进程优先级,需要更改不是pri,而是Ni。
更改优先级:
命令行输入top->r->输入要更改进程的pid->回车->输入nice的值(范围-20~19一共40个级别)->回车。
naic的取值范围[-20,19]
priority的取值范围[60,99]
10.竞争性_独立性_并行_并发_进程间切换
竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级
独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰,不会因为一个进程挂掉或者异常,而导致其他进程出现问题
并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行
并发: 多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发
多个进程都在你的系统中运行!= 多个进程都在你的系统中同时运行
不要以为进程一旦占用CPU,就会一直执行到结束,才会释放CPU资源!我们遇到的大部分操作系统都是分时的!操作系统会给每一个进程,再一次调度周期中,赋予一个时间片的概念,在一个是时间段,多个进程都会通过切换交叉的方式,让多个进程代码,在一段时间内都得到推进,这个现象,我们叫做并发。
操作系统,就是简单的根据队列来进行先后调度的吗?如何突然来一个优先级更高的进程?
抢占式内核,正在运行的低优先级进程,如果来个优先级更高的进程,我们的调度会直接把进程从CPU上剥离,放上优先级更高的进程,进程抢占。
进程间切换:
CPU的寄存器是:可以临时的存储数据,非常少,但非常重要。
当进程再被执行的过程中,一定会存在大量是临时数据,会暂时存在CPU内的寄存器中。
我们把进程在运行中产生的各种寄存器数据,叫做进程的上下文数据。
当进程被剥离:需要保存上下文数据
当进程恢复的时候:需要将曾经保存的上下文数据恢复到寄存器中
上下文在哪里保存?
task_struct
三、环境变量
为什么代码运行要带路径,而系统的指令不用带路径?
执行一个可执行程序,前提是要先找到它!
系统中是存在相关的环境变量(PATH),保存了程序的搜索路径的!
1.环境变量操作
查看所有环境变量:
env
显示某一个环境变量:
echo $变量名
echo $PATH
命令行定义本地变量:
a=100
查看本地变量:
set 变量(本地变量和环境变量都可以查到)
set a
注:本地变量不能被env查到
导出环境变量:
export bbbb=223
可以被env查到:
env |grep bbbb
取消环境变量:
unset 环境变量
总结:
查看环境变量: env
查看变量(可以是环境变量也可以是环境变量):set
查看某一个环境命令:eche $环境变量
导出环境变量:export 环境变量
取消环境变量:unset 环境变量
命令行变量分两种:
1.普通变量
2.环境变量(全局)
2.让自己程序和命令一样执行
如何让自己的程序不用带路径?
系统会在环境变量PATH你找可执行程序,如果存在就会执行,例如:cd,ls,touch…也就是说,我们将程序的路径导入PATH里,就可以像系统命令一样执行。
先查找当前程序路径,在导入路径到PATH:
pwd
export PATH=$PATH:路径
: 是路径的分隔符。
注:这只是暂时的,重新远程登陆,环境变量就会被重置,导致失效。如果想永久实现这个效果,需要修改配置文件,但不建议,会污染命令池。
3.常见环境命令
PATH : 指定命令的搜索路径
HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
SHELL : 当前Shell,它的值通常是/bin/bash。
4.环境变量的C、C++获取方式(代码如何获取环境变量)
1、mian函数参数获取环境变量
main函数可以带参数吗?最多可以带多少?
#include<stdio.h>
int main(int argc,char* argv[])
{
int i = 0;
for(i=0;i<argc;i++)
{
printf("argv[%d]:%s\n",i,argv[i]);
}
return 0;
}
我们给main函数传递的agrc,char* argv[],命令行参数传递的是,命令行中输入的程序名和选项!那么意义是什么?
同一个程序,通过传递不同的参数,让同一个程序有不同的执行逻辑,执行结果。Linux系统中会根据不同的选项,让不同的命令,可以有不同的表现!指令中那么多选项的由来和起作用的方式。下面有小实例演示:
想实现命令行计数器:
./myproc -a 10 20
10+20=30
./myproc -s 10 20
10-20=-10
#include<stdio.h>
#include<string.h>
#include<stdlib.h>
void usage()
{
printf("输入有误,命令使用规则:\n");
printf("加法:./myproc -a 参数1 参数2\n");
printf("减法:./myproc -s 参数1 参数2\n");
}
int main(int argc,char* argv[])
{
if(argc!=4)
{
usage();
}
else
{
if(strcmp(argv[1],"-a")==0)
{
int a = atoi(argv[2]);
int b =atoi(argv[3]);
printf("%d+%d=%d\n",a,b,a+b);
}
else if(strcmp(argv[1],"-s")==0)
{
int a =atoi(argv[2]);
int b =atoi(argv[3]);
printf("%d-%d=%d\n",a,b,a-b);
}
else
{
usage();
}
}
return 0;
}
回到第一问,main函数可以带几个参数?
可以带三个,一个进程是会被传入环境变量参数的!
#include<stdio.h>
int main(int agrc,char* argv[],char*env[])
{
for(int i = 0;env[i];i++)
{
printf("env[%d]:%s\n",i,env[i]);
}
return 0;
}
扩展:
一个函数在声明是时候没有带参数,可以给这个函数传参吗?
可以。只有fun(void)传参数才会报错。下面演示:
#include<stdio.h>
void fun()
{
prinf("hello world!\n");
}
int main()
{
fun(10,29.3,20);
return 0;
}
2、通过C语言提供的全局变量获取 - environ
#include<stdio.h>
int main()
{
extern char** environ;
for(int i =0;environ[i];i++)
{
printf("%d:%s\n",i,environ[i]);
}
return 0;
}
3、获取环境变量函数 - getenv(const char* name)
查看接口:
#include<stdio.h>
#include<stdlib.h>
int main()
{
const char* s = getenv("PATH");
printf("%s\n",s);
return 0;
}
为什么要获取环境变量?
一定有特殊用途,比如说:程序可以通过获取环境变量,获取用户信息来确定是否有权限执行。
环境变量是谁给的?
1.命令行启动程序父进程都是bash
2.环境变量是会被子进程继承下去的
3.环境变量是全局变量。
所谓的本地变量,本质就是在bash内部定义的变量,不会被子进程继承下去!
Linux下大部分命令都是通过子进程的方式执行的!
但是,还有一部分命令,不通过子进程的方式执行,而是由bash自己执行(调用自己的对应的函数来完成特定的功能),我们把这种命令叫做内建命令。