<Linux>进程控制

进程控制

在这里插入图片描述

文章目录

  • 进程控制
  • 一、进程创建
    • 1.fork函数认识
    • 2.写时拷贝
    • 3.fork常规用法
    • 4.fork调用失败的原因
  • 二、进程终止
    • 1.进程退出场景
    • 2.进程退出码
    • 3.进程退出的方式
  • 三、进程等待
    • 1.进程等待是什么?
    • 2.进程等待的必要性
    • 3.进程等待的方法
      • 3.1.wait函数
      • 3.2.waitpid函数
    • 4.如何获取子进程status
      • 4.1.如何理解status参数?
      • 4.2.获取退出码和退出信号
    • 3.阻塞等待和非阻塞等待
  • 四、进程替换
    • 4.1 替换原理
    • 4.2 替换函数
    • 4.4 exec*接口介绍
    • 4.5.替换函数使用实例

一、进程创建

1.fork函数认识

在Linux中fork函数非常的重要,它的作用是在一个已经存在的进程中创建一个新进程。新进程叫做子进程,原来的进程叫做父进程。

函数名称fork
函数功能创建子进程
头文件#include<unistd.h>
函数原型pid_t fork(void);
参数
返回值>-1:成功(其中子进程返回0,父进程返回子进程的id) =-1:失败

进程调用fork,当控制转移到内核中的fork代码后,内核要做的是:

  • 分配新内存和数据结构给子进程
  • 将父进程部分数据结构内容拷贝至子进程中
  • 添加子进程到系统进程列表中
  • fork返回,调度器开始调度

image-20230321150254261

当一个进程调用了fork之后,父子进程代码是共享的,虽然他们都运行到了相同的地方,但是每个进程都可以开始自己的旅程:

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
int main()
{
  printf("Before:pid is: %d\n",getpid());
  pid_t pid = fork();
  
  if(pid == -1)
  {
      perror("fork()");
      exit(1);
  }
  printf("after:pid is: %d,return is %d\n",getpid(), pid);
  sleep(1);
  return 0;
}

结果展示:
image-20230318180412106
我们可以看到,第一行输出是fork之前,只有父进程在执行,打印了before信息,fork创建子进程后,打印了两行after信息,分别由父子进程打印,注意到,进程29404打印了before的pid,而另外一个after却没有打印,这是为啥呢?

image-20230321151026918

所以,fork之前父进程独立执行,fork之后,两个父子进程执行流分别执行
注意:fork之后谁先执行,完全由调度器决定。(父子都有可能先执行)

2.写时拷贝

通常,父子代码共享,父子不再写入时,数据也是共享的,当任意一方试图写入时,便以写时拷贝的方式各自一份副本(在物理内存中)。
image-20230321151116761

3.fork常规用法

  • 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
  • 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数

4.fork调用失败的原因

以下两种原因可能会导致fork调用失败:

  • 系统中有太多的进程
  • 实际用户的进程数超过了限制

我们写一个死循环创建子进程的程序测试我们当前操作系统最多能创建多少个进程:

image-20230318211939548

注意:上面这个程序可能会导致服务器或虚拟机直接挂掉,虚拟机的话,大家只需要使用shotdown命令关机重启即可,服务器则需要去服务器控制台进行重启。

二、进程终止

1.进程退出场景

  • 代码运行完毕,结果正确
  • 代码运行完毕,结果不正确
  • 代码异常终止(vs下叫做程序崩溃)

2.进程退出码

我们先前写C/C++代码的时候,都会在入口函数main函数开始写,我们总是喜欢在结尾的时候给上一个return 0,继而引发出了如下的两个问题:

  1. return 0,给谁return?
  2. 为何是0?其它值可以吗?

下面一次解决:

  • 1、return 0,给谁return?

给父进程,具体理由在下面会有讲解。

  • 2、为何是0?其它值可以吗?

返回值代表的是进程代码跑完,结果是否正确,如果是0,则成功,非零则失败。所以我们在写一个程序的时候,如果测试结果正确,这里我们可以给上return返回值0,可如果不正确,我们return的应该是其他值以此表示结果失败,只不过我们平时都无脑return 0了,准确说是不太正确的。

此外,失败虽是用非零值表示,可也是有讲究的,结果成功都是用0表示,结果失败反倒用不同的数字来表示,以此表示失败的不同原因。所以我们把main函数的return返回值称之为进程退出码!!进程退出码表征了进程退出的信息,此信息是要给父进程去读取的。

示例:

我们可以通过如下的指令查看退出码:

echo $?

$?表示在bash中,最近一次执行完毕时,对应进程的退出码!(说的简单点就是上一条指令执行完毕后的退出码)

image-20230321161445190

再比如我们平时在命令行输入的指令,诸如ls、cd……类的,其退出码均为0,表示结果正确,可是当你随便输入一条错误指令的时候,其退出码则是某一数字表示结果错误:

image-20230321162044015

问:一般而言,失败的的非零值我该如何设置呢?以及默认表达的含义?

  • C语言当中的strerror函数可以通过错误码,获取该错误码在C语言当中对应的错误信息。
  • **总结:**错误码退出码可以对应不同的错误原因,方便定位问题!
  • 这里就可以提出我们退出码的意义?

它能够表示结果的正确与否,正确用0表示,因为那么多个数字,0只有一个,但是错误却有多个,用非0数字表示,错误的原因也是有多种可能的

退出码也是不能够随意乱写的,每一个退出码对应的数字,代表不同的错误,我们可以利用函数接口strerror观察有哪些错误码

#include<stdio.h>
#include<string.h>
int main()
{
  for(int i=0;i<150;i++)
  {
    printf("%d:%s\n",i,strerror(i));
  }
  return 0;
}

结果展示部分错误码对应的错误原因:
image-20230321155037024

3.进程退出的方式

正常终止

  • 1、main函数中return返回,代表退出进程;而非main函数中return返回表示的就是普通的函数返回/结束调用

  • 2、调用exit函数,它在程序的任意地方调用都是代表终止进程,参数是退出码,exit函数会完成一些收尾工作,例如资源的清理和释放,刷新缓冲区等

  • 3、调用_exit函数,它的作用是强制终止进程,不要进行后续收尾工作,比如刷新缓冲区(用户级别的缓冲区!)

异常终止

  • 【ctrl + c】信号终止

介绍return退出、exit函数和_exit函数
return退出
return退出是一种最为常见的一种退出进程的方法,执行return n等于执行exit(n),因为调用main函数运行时,会将main的返回值当做exit的参数。
image-20230321195350521
exit函数

exit函数是标准C库中的一个库函数。

函数名称exit
函数功能正常终止一个进程
头文件#inlcude<stdlib.h>
函数原型void exit(int status)
参数status:程序退出的状态
返回值

image-20230321200121413
执行并查看退出码:
image-20230321195925048
在调用exit之前,还会做一些其他的工作,

  1. 执行用户通过atexit或者on_exit定义的清理函数
  2. 关闭所有打开的流,所有的缓冲数据均被写入
  3. 调用_exit函数

image-20230321201511958
结果展示:image-20230321201533556
_ exit函数
_ exit也是标准C库中的一个库函数,它和_ Exit函数调用同义。

函数名称_exit
函数功能正常终止一个进程
头文件#include<unistd.h>
函数原型void _exit(int status)
参数status 定义了进程的终止状态,父进程通过wait来获取该值
返回值

_exit是强制退出进程,并不进行后续的收尾工作!image-20230321203112194

注意:status定义了进程的终止状态,父进程通过wait来获取该值,虽然status是int,但是仅有低八位可以被父进程所用。所以_exit(-1)时,在终端执行echo $?时,发现返回值是255。image-20230321203543756

_exit和exit的作用都是终止进程,但是还是有点区别的,区别如下:image-20230321201551165

结果演示:image-20230321201617371

exit_exit函数的区别:

exit函数退出进程前,exit函数会执行用户定义的清理函数、刷新缓冲区,关闭流等操作,然后再终止进程,而_exit函数会直接终止进程,不会做任何收尾工作。

image-20230321202350218

三、进程等待

1.进程等待是什么?

让父进程fork之后,需要通过wait或者waitpid等待子进程退出,父进程想要知道子进程完成的任务情况如何了。

2.进程等待的必要性

  • 之前讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏问题,需要通过父进程wait,释放子进程占用的资源
  • 另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程
  • 最后,父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果对还是不对,或者是否正常退出。父进程需要获得子进程的退出状态
  • 父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息(status),能够得知子进程的执行结果
  • 可以保证“时序问题”,那就是保证子进程先退出,父进程后退出。

3.进程等待的方法

利用系统级别的函数waitwaitpid

3.1.wait函数

函数名称wait
函数功能暂停当前进程,直至子进程结束,并取回子进程结束时的状态
头文件#include<sys/wait.h>
函数原型pid_t wait(int *status)
参数status:子进程终止状态的地址
返回值等待成功返回被等待进程pid,失败返回-1

说明:输出型参数status,获取子进程状态,不关心时可以设置为NULL

作用:等待任意子进程

我们写一段代码来看一看,fork之后我们先让子进程运行5秒,之后子进程退出,而让父进程一直在等待(调用wait函数),我们就能看到进程等待的现象。

#include<stdio.h>
#include<string.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdlib.h>

int main()
{
	pid_t id = fork();
	if (id == 0)
	{
		//child
		int cnt = 5;
		while (cnt)//5秒后子进程退出
		{
			printf("child is running!,pid:%d, cnt:%d\n", getpid(), cnt);
			cnt--;
			sleep(1);
		}
		exit(0);//退出子进程
	}
	printf("father wait begin!\n");
	sleep(5);//父进程休眠5秒
	pid_t ret = wait(NULL);
	if (ret > 0)
	{
		printf("father wait:%d,sucess\n", ret);
	}
	else
	{
		printf("father wait failed!\n");
	}
	sleep(5);//子进程被回收之后,让父进程再运行5秒钟
	return 0;
}

我们可以使用以下监控脚本对进程进行实时监控:

while :; do ps axj | head -1 && ps axj | grep proc1 | grep -v grep;echo "—————————————————————————————————————————————————————————————————";sleep 1;done

运行结果如下:image-20230322083936454

这时我们可以看到,当子进程退出后,父进程读取了子进程的退出信息,子进程也就不会变成僵尸进程了。 由此得知我们可以通过wait()的方案解决回收子进程Z状态,让子进程进入X。

3.2.waitpid函数

函数名称waitpid
函数功能获取子进程结束时的状态
头文件#include<sys/wait.h>
函数原型pid_t waitpid(pid_t pid, int *status, int options)
参数pid:指定的子进程PID
status:子进程终止状态的地址
options:控制操作方式的选项
返回值1、> 0 等待子进程成功,当正常返回的时候waitpid返回收集到的子进程的进程ID;
2、 如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程可收集,则返回0;
3、如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在;

对于三个参数进一步说明:

pid
1、pid<-1等待进程组识别码为pid绝对值的任何子进程.
2、pid=-1 等待任何子进程,相当于wait().
3、pid=0 等待进程组识别码与目前进程相同的任何子进程.
4、pid>0 等待任何子进程识别码为pid的子进程.

status
用下面的常用的两个宏:

  • WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
  • WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)

options:

  • 0:默认行为,阻塞等待(父进程什么都不做,就是等待子进程退出)
  • WNOHANG:设置等待方式为非阻塞等待

注意:当一个进程非正常退出时,说明该进程是被信号所杀,那么该进程的退出码也就没有意义了

  • 如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
  • 如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
  • 如果不存在该子进程,则立即出错返回。

下面再来强调下第二个参数:status

status是一个输出型参数,通过调用该函数,从函数内部拿出来特定的数据,也就是从操作系统拿到特定数据。

子进程退出的时候会将自己的退出信息写入自己的task_struct,随后变成Z状态,随后父进程调用wait / waitpid接口,通过status把子进程的退出码拿到。

4.如何获取子进程status

4.1.如何理解status参数?

  • wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
  • 如果传递NULL,表示不关心子进程的退出状态信息。
  • 否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
  • status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特位)

image-20230321211314684

解释上图:

  • 在status的低16比特位当中,高8位表示进程的退出状态,即退出码。进程若是被信号所杀,则低7位表示终止信号,而第8位比特位是core dump标志。

我们通过一系列位操作,就可以根据status得到进程的退出码和退出信号。

exitCode = (status >> 8) & 0xFF; //退出码
exitSignal = status & 0x7F;      //退出信号

对于此,系统中提供了两个宏来获取退出码和退出信号。

  • WIFEXITED(status):用于查看进程是否是正常退出,本质是检查是否收到信号。
  • WEXITSTATUS(status):用于获取进程的退出码。
exitNormal = WIFEXITED(status);//是否正常退出
exitCode = WEXITSTATUS(status);//获取退出码
  • 需要注意的是,当一个进程非正常退出时,说明该进程是被信号所杀,那么该进程的退出码也就没有意义了。

4.2.获取退出码和退出信号

我们通过位运算可以,根据status得到退出码和退出信号:

#include<stdio.h>
#include<string.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
  pid_t id=fork();
  if(id==0)
  {
    //child
    int cnt=5;
    while(cnt)
    {
        printf("child is running! pid:%d, cnt:%d\n",getpid(), cnt);
        cnt--;
        sleep(1);
    }
    exit(10);
  }
  printf("father wait begin!\n");
  sleep(10);
  //pid_t ret =wait(NULL);
  int status=0;
  pid_t ret=waitpid(id,&status,0);
  if(ret>0)
  {
     printf("father wait:%d sucess,status wait code:%d,status exit signal:%d\n",ret,(status>>8)&0xFF,status&0x7F);
  }
  else
  {
  	 printf("father wait failed!\n");
  }
  sleep(10);
  return 0;
}

结果如下:image-20230322004906378

status的最低7位表示进程退出时收到的信号,进程如果异常退出,是因为这个进程收到了特定的信号,我们先前kill -9 pid就是在进程异常时退出而发出的信号。下面来模拟下进程的异常退出:

#include<stdio.h>
#include<string.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
  pid_t id=fork();
  if(id==0)
  {
    //child
    while(1)
    {
        printf("child is running! pid:%d, cnt:%d\n",getpid(), cnt);
        sleep(1);
    }
    exit(10);
  }
  printf("father wait begin!\n");
  sleep(10);
  //pid_t ret =wait(NULL);
  int status=0;
  pid_t ret=waitpid(id,&status,0);
  if(ret>0)
  {
     printf("father wait:%d sucess,status wait code:%d,status exit signal:%d\n",ret,(status>>8)&0xFF,status&0x7F);
  }
  else
  {
  	 printf("father wait failed!\n");
  }
  sleep(10);
  return 0;
}

这里子进程是在无限循环的,父进程只能阻塞等待,现在我们把子进程kill掉,结果如下:

image-20230322005334715

如果kil -3 pid,退出信号就是3……当进程收到信号的时候,就代表进程异常了。

image-20230322005416450

综上:退出信号代表进程是否异常,退出码代表程序跑完后的结果正确与否。

问:一个进程退出的时候,父进程会拿到退出码和退出信号,那到底先看谁呢?

  • 一旦进程出现异常,只关心退出信号,退出码没有任何意义。

强调系统中的两个宏:

status:
    WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
    WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)

我们对于位操作是不是有点太过复杂和麻烦了,我们可以用上文提到的来代替位操作:

#include<stdio.h>
#include<string.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdlib.h>
int main()
{
	pid_t id = fork();
	if (id == 0)
	{
		//child
		int cnt = 5;
		while (cnt)
		{
			printf("child[%d] is running! cnt is %d\n", getpid(), cnt);
			cnt--;
			sleep(1);
		}
		exit(11);
	}
	printf("father wait begin!\n");
	sleep(10);
	//pid_t ret =wait(NULL);
	int status = 0;
	pid_t  ret = waitpid(id, &status, 0);
	if (ret>0)
	{
		if (WIFEXITED(status))//没有收到任何退出信号
		{	//正常结束,获取对应的退出码
			printf("exit code:%d\n", WEXITSTATUS(status));
		}
		else
		{
			printf("error get a signal!\n");
		}
	}
	/*if (ret > 0)
	{
		printf("father wait:%d sucess,status wait code:%d,status exit signal:%d\n", ret, (status >> 8) & 0xFF, status & 0x7F);
	}

	else
	{
		printf("father wait failed!\n");

	}*/
	sleep(10);
	return 0;
}

结果展示:

image-20230322005023808

3.阻塞等待和非阻塞等待

再来强调下waitpid函数中的最后一个参数options,当其值为0时,就是阻塞等待,当为WNOHANG时,就是非阻塞等待。下面展开讨论:

阻塞等待:

  • 如果子进程就是不退出(如死循环),怎么办呢?我的父进程只能阻塞等待。

  • 当我们调用某些函数的时候,因为条件不就绪(可能是任意的软硬件条件),需要我们阻塞等待,本质就是当前进程自己变成阻塞状态,当条件就绪的时候再被唤醒。

详细说明:

  • 就是一个进程在系统层面上因为要等待某种事件发生,如果这个事件并没有发生,那么当前进程的代码和数据将无法运行,此时就要进入阻塞状态,也就是将父进程的task_struct的状态由R->S,从运行队列投入到等待队列,等待子进程退出,当子进程退出了,本质就是条件就绪,那么就会逆向执行上述操作,将进程从等待队列搬到运行队列,并将状态由S->R。

举例:

  • 假设你叫李四,是个大混子,天天不学习,马上就要考数据结构了,为了能够及格,你打电话给了你班的一位学霸朋友张三来让他教我,整个过程我就是一个进程,打电话的过程就是在调用接口,张三就是所谓的OS操作系统,当电话接通了,但是张三说他在忙,于是我让张三别挂电话,我在电话这头一直等待你,此时这个等待过程中我什么也没干,只是等待张三,也就是说父进程在等待期间不做任何事情,这个过程就是阻塞等待。

非阻塞等待:

举例:

  • 此时重复上述场景,当电话接通后,张三表示还在忙,那么我直接挂电话,此时我做些自己的事情,忙了一会后又给张三打了个电话,张三还在忙,那么我又挂电话继续做自己的事情,while(1)重复循环直至张三说自己ok了。

详细说明:

  • 整个过程我依旧是用户,张三是OS操作系统,打电话就等价于调用waitpid函数,相当于是用户问操作系统子进程是否退出,当OS回应没有时,此时waitpid直接返回,此时用户不会调用wait而将自己阻塞住,此时用户在空闲时间段内做自己的事情,做一会之后再去问OS操作系统好了没,这个过程就叫做非阻塞等待。这种多次调用非阻塞接口,就是轮询检测。

总结:

1、阻塞等待:死等,就是上述的情况,父进程一直等待子进程,父进程不做任何事情。
2、非阻塞等待:我们可以不要让父进程死等,而是在等待期间,父进程去做自己的事情,等子进程退出时再来检测子进程的运行状态

代码示例:

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>

int main()
{
	pid_t id = fork();
    assert(id != -1);
	if (id == 0)
	{
		//子进程
		while (1)
		{
			printf("我是子进程,我的pid:%d, 我的ppid:%d\n", getpid(), getppid());
			sleep(3);
		}
		exit(10);
	}
	else if (id > 0)
	{
		//父进程
		//基于非阻塞的轮询等待方案
   		int status = 0;
		while (1)
		{
			pid_t ret = waitpid(id, &status, WNOHANG);// WNOHANG:非阻塞->子进程没有退出,父进程检测时候,立即返回
			if (ret > 0)
			{
             //waitpid调用成功,子进程退出了
   				printf("等待成功,%d,退出信号是:%d,退出码是:%d\n", ret, status & 0x7F, (status >> 8) & 0xFF);
				break;
			}
			else if (ret == 0)
			{
				//(waitpid调用成功了)等待成功了,但是子进程没有退出
             //子进程没有退出,我的waitpid没有等待失败,仅仅是检测到了子进程没有退出
   				printf("子进程完成没?还没有,那么我父进程就做其他事情啦...\n");
				sleep(1);
			}
			else
			{
				//waitpid调用失败
             printf("waitpid调用失败了\n");
   			}
		}
	}
	else
	{
		//do nothing   
	}
	return 0;
}

运行结果就是,父进程每隔一段时间就去查看子进程是否退出,若未退出,则父进程先去忙自己的事情,过一段时间再来查看,直到子进程推出后读取子进程的退出信息。

image-20230321235109895

现在增加点设计,模拟让父进程在等待的过程中做些自己的事情,如下的代码:

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
#define NUM 10
typedef void (*func_t)(); //函数指针
func_t handlerTask[NUM];
//样例任务
void task1()
{
 printf("handler task1\n");
}
void task2()
{
 printf("handler task2\n");
}
void task3()
{
 printf("handler task3\n");
}
void loadTask()
{
     memset(handlerTask, 0, sizeof(handlerTask));
     handlerTask[0] = task1;
     handlerTask[1] = task2;
     handlerTask[2] = task3;
}
int main()
{
	pid_t id = fork();
 	assert(id != -1);
	if (id == 0)
	{
		//子进程
		while (1)
		{
			printf("我是子进程,我的PID:%d, 我的PPID:%d\n", getpid(), getppid());
			sleep(3);
		}
		exit(10);
	}
	else if (id > 0)
	{
		//父进程
		//基于非阻塞的轮询等待方案
        loadTask();
		int status = 0;
		while (1)
		{
			pid_t ret = waitpid(id, &status, WNOHANG);// WNOHANG:非阻塞->子进程没有退出,父进程检测时候,立即返回
			if (ret > 0)
			{
             // waitpid调用成功,子进程退出了
				printf("等待成功,%d,退出信号是:%d,退出码是:%d\n", ret, status & 0x7F, (status >> 8) & 0xFF);
				break;
			}
			else if (ret == 0)
			{
				//(waitpid调用成功了)等待成功了,但是子进程没有退出
             //子进程没有退出,我的waitpid没有等待失败,仅仅是检测到了子进程没有退出
				printf("子进程完成没?还没有,那么我父进程就做其他事情啦...\n");
             for(int i = 0; handlerTask[i] != NULL; i++)
             {
                 handlerTask[i](); // 采用回调的方式,执行我们想让父进程在空闲的时候做的事情
             }
				sleep(1);
			}
			else
			{
				//waitpid调用失败
             printf("waitpid调用失败了\n");
			}
		}
	}
	else
	{
		//do nothing   
	}
	return 0;
}

image-20230321235740416

过程描述:父进程每隔一秒就去看看自己进程退出没有,若没有就继续等待,若退出了,就获取退出码。

四、进程替换

4.1 替换原理

程序替换的概念

  • 用fork创建子进程后,子进程执行的是和父进程相同的程序(但有可能执行不同的代码分支),若想让子进程执行另一个程序,这就需要用到程序替换,而完成程序替换需要用到exec函数。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,并从新程序的启动李成开始执行。

为什么要完成程序替换

我们一般在服务器设计(linux变成)的时候,往往需要子进程干两件种类的事情:

  1. 让子进程执行父进程的代码片段(服务器代码)
  2. 让子进程执行磁盘中一个全新的程序(shell,想让客户端执行对应的程序,通过我们的进程。执行其他人写的进程代码等待),如C/C++(自己写的) -> C/C++/Python/Shell/Php/java……(别人写的)

上述的第二点需求就是用我自己写的C/C++代码调用别人不同语言的代码程序,完成这一项需求就需要用到程序替换。

程序替换的原理

如下图所示:

  • 前面我们学习到,当fork创建子进程的时候,子进程的PCB、虚拟地址空间都以父进程为模板,页表中的代码段指向的是父进程中的代码段,数据也以写时拷贝的方式来和父进程进行共享,如果现在有一个全新的程序b.exe,并且我现在不想让子进程执行任何父进程相关的代码以及访问父进程的数据,并执行的是b.exe程序,此时把b.exe的程序加载到物理内存上,让子进程重新调整自己的页表映射,使其指向新的b程序的代码和数据,这种过程就叫做程序替换。

image-20230322230314116

总结程序替换的原理:

  1. 将磁盘中的程序,加载入内存结构
  2. 重新建立页表映射,谁执行程序替换,就重新建立谁的映射,最终达到的效果就是让父进程和子进程彻底分离,并让子进程执行一个全新的程序!!!

问1:当进行程序替换时,有没有创建新的进程?

  • 进程程序替换后,该进程对应的PCB、进程地址空间以及页表等数据结构均没有发生改变,只是重新建立了一下物理内存中的映射关系罢了,它的内核对应的数据结构没有发生变化,他的pid也没有发生变化,也就没有创建新的进程,只不过是让进程执行不同的程序罢了!!!

问2:子进程进行进程程序替换后,会影响父进程的代码和数据吗?

  • 子进程刚被创建时,与父进程共享代码和数据,但当子进程需要进行进程程序替换时,也就意味着子进程需要对其数据和代码进行写入操作,这时便需要将父子进程共享的代码和数据进行写时拷贝,此后父子进程的代码和数据也就分离了,因此子进程进行程序替换后不会影响父进程的代码和数据。

问3:为什么要加载到内存中呢?

因为数据是存储在外设磁盘上的,CPU距离内存最近,读取是最方便的!

代码演示:

#include<stdio.h>
#include<unistd.h>
int main()
{
    printf("I am a process! pid:%d\n", getpid());
    execl("/usr/bin/ls","ls","-a","-l",NULL);
    //本该执行下面的hello程序的,但是调用execl替换了代码和数据,将会执行ls等命令
    printf("process done, pid:%d\n", getpid());
    return 0;
}

结果展示:
image-20230322091001489
程序替换的本质:就是把程序的代码和数据,加载到特定的进程的上下文中!
我们平时写的C/C++程序要运行,必须先加载到内存中!如何加载呢?——加载器!(封装的底层就是exec系列的程序替换函数)

现在我们想让子进程也进行程序替换:

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/wait.h>
int main()
{
  if(fork()==0){//child
    printf("command begin...\n");
    execl("/usr/bin/ls","ls","-a","-l","-i",NULL);
    printf("command end...\n");
    exit(1);
  }

  //father
  waitpid(-1,NULL,0);//等待任意一个子进程
  printf("father wait success!\n");
  return 0;
}

结果展示:
image-20230323165857823
 当我们在执行子进程的替换时,我们的父进程照常执行自己的任务,两者之间互不影响呢?那是因为进程之间具有独立性!

4.2 替换函数

其实有6种以exec开头的函数,统称为exec函数

六种替换函数(实际上七种,换汤不换药):

  • 上述过程中的程序替换是我们通过调用接口(函数)来让OS操作系统帮助我们完成的,此接口就是替换函数,替换函数有六种以exec开头的函数,他们统称为exec函数:
#include <unistd.h>`
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);

只要程序替换成功,就不会执行后续的代码,意味着exec* 系列的函数,执行成功的时候就不需要返回值检测!只要exec* 返回了,那就意味着替换失败,调用函数也失败了!(返回-1)所以exec函数只有出错的返回值而没有成功的返回值!

4.4 exec*接口介绍

函数名参数格式是否带路径是否使用当前环境变量
execl列表不带
execlp列表
execle列表不带不是,需要自己组装环境变量
execv数组不带
execvp数组
execve数组不带不是,需要自己组装环境变量

函数解释:

  • 这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回
  • 如果调用出错则返回-1
  • 所以exec函数只有出错的返回值而没有成功的返回值

命名理解:

这六个exec系列函数的函数名都以exec开头,其后缀的含义如下:

  • l(list):表示参数可用列表的形式,一一列出
  • v(vector):表示参数采用数组的形式
  • p(path):表示能自动搜索环境变量PATH,进行程序查找
  • e(env):表示可以传入自己设置的环境变量

事实上,只有execve是真正的系统调用,其它五个函数最终都是调用的execve,所以execve在man手册的第2节,其它五个函数在man手册的第3节,也就是说其它五个函数实际上是对系统调用execve进行了封装,以满足不同用户的不同调用场景的需求。

image-20230322092312670

下图为exec系列函数族之间的关系:

4.5.替换函数使用实例

我们如果要执行一个全新的程序,需要做2件事情:

  1. 先找到这个程序在哪里

  2. 程序可能携带选项进行执行(也可以不携带),要明确告诉OS操作系统,我想怎么执行这个程序?要不要带选项?

下面几个替换函数均是按照上述逻辑执行的。

1、execl

int execl(const char *path, const char *arg, ...);
  • 第一个参数是要执行程序的路径
  • 第二个参数是可变参数列表(我们可以按照用户的意愿传入数量大小不等的参数),表示你要如何执行这个此程序,命令行怎么写(ls -l -a),这个参数就怎么填 “ls”,“-l”,“-a”,并以NULL结尾。

示例:

假设我执行的是ls -l -a程序:

当我make之后,会生成myexec可执行程序,现在运行此程序:

image-20230322193801732

当我执行top、pwd命令也亦是同样的操作:

image-20230322194134470

  • 此时一个现象就产生了,当我调用execl替换程序函数成功后,后面的printf语句并没有执行,原因就在于一旦execl替换成功,是将当前进程的代码和数据全部替换了,后面的printf自然就被替换了,即该代码就不存在了。

问:程序替换用不用判断返回值?

  • 程序替换不用判断返回值,这就是我们前面提到的,因为一旦程序替换成功了,就不会有返回值,而失败的时候,必然会向后执行,最多通过返回值得到什么原因导致的替换失败。

下面演示进程替换失败的场景(只需随便执行一个不存在的程序即可)

image-20230322194945486

我们的上述操作是一个单进程程序,我没有创建子进程,相当于是把父进程的代码给替换了,现在想让子进程完成替换操作,如下:

image-20230322200011991

上述操作就完成了让子进程执行全新的程序,以前是执行父进程的代码片段,运行结果如下:

image-20230322200046710

问:子进程执行程序替换,会不会影响父进程呢?

  • 答案是不会的,这个我上面详细讲解过,总结就是进程具有独立性,当程序替换的时候,代码和数据都发生了写时拷贝完成父子的分离。
#include <stdio.h>
#include <unistd.h>

int main()
{
     printf("我是一个进程,我的pid:%d\n", getpid());
     // ls -l -a;                                                                                                                          
     execl("usr/bin/ls", "ls", "-l", "-a", NULL);
     printf("我执行完了,我的pid:%d\n", getpid());                                              
     return 0;                                        
}                   

2、execv

int execv(const char *path, char *const argv[]);
  • 第一个参数是要执行程序的路径
  • 第二个参数是一个字符指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾

例如,要执行的是ls -l -a -i

char *const argv_[] = { (char*)"ls", (char*)"-a", (char*)"-l", (char*)"-i", NULL };
execv("/usr/bin/ls", argv_);

前面的execl是一个一个参数传过去的,这里execv是直接传一个指针数组,示例如下:

image-20230322201556649

image-20230322202424098

补充:vim批量化注释、取消注释小技巧

  • 注释:小写,ctrl+v,hjkl选中区域,切换大写,输入I,//,esc
  • 取消注释:小写,ctrl+v,hjkl选中区域(注释区域),输入d

3、execlp

int execlp(const char *file, const char *arg, ...);
  • 第一个参数是要执行程序的名字
  • 第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾

例如,要执行的是ls -a -l

execlp("ls", "ls", "-a", "-l", NULL );

它和execl唯一的区别就是多了一个p,在我们执行指令的时候,默认的搜索路径是在环境变量PATH搜索的,而execl中的p就是此PATH环境变量,前面我们的execl和execv都是要指明路径的,而这里execlp命名带p了,因此就可以不带路径,只说出你要执行哪一个程序即可。示例:

image-20230322202801090

image-20230322202858003

  • 这里出现了两个ls,含义是不一样的,第一个参数是供系统去找你要执行谁的,第二个是你想怎么执行它。

4、execvp

int execvp(const char *file, char *const argv[]);
  • 第一个参数是要执行程序的名字
  • 第二个参数是一个字符指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾

例如,要执行的是ls -a -l -i

char *const argv_[] = { (char*)"ls", (char*)"-a", (char*)"-l", (char*)"-i", NULL };
execvp("ls", argv_);

此替换函数同样是带了p,所以它是从PATH路径里头找,我们只需要程序名即可,还带了v,我们就可以将命令行参数字符串统一放入数组中即可完成调用。示例:

image-20230322203829319

image-20230322203848533

5、execle

在正式讲解此替换函数execle前,先来看这样一个问题:

  • 目前我们执行的程序,全部都是系统命令,如果我们要执行自己写的C/C++程序呢?如果我们要执行其它语言写的程序呢?

首先,一次makefile默认只能生产一个可执行程序,但是按如下修改一次可生产多个可执行程序:

image-20230322204632610

现在有两个可执行程序,我现在的目标是让myexec把mycmd调起来,代码如下:

execl("/home/xzy/dir/date16/mycmd", "mycmd", NULL);//绝对路径                                             //execl("./mycmd", "mycmd", NULL);相对路径

详情如下:

image-20230322210755981

image-20230322210405428

image-20230322210908223

上述实现了C可执行程序调C++可执行程序,现在来实现C可执行程序调用python可执行程序,如下一个python小脚本:

image-20230322211310215

现在想让C可执行程序myexec来调用python,只需如下操作:

execl("/usr/bin/python3", "python3", "test.py", NULL); 

image-20230322211525802

解决了刚刚那个问题,现在再回过头来看execle替换函数:

int execle(const char *path, const char *arg, ..., char * const envp[]);
  • 第一个参数是要执行程序的路径
  • 第二个参数是可变参数列表,表示你要如何执行这个程序,并以NULL结尾
  • 第三个参数是你自己设置的环境变量

以我设置的"MYPATH"环境变量为例:

char* const env_[] = { (char*)"1314520",  NULL };
execle("./mycmd", "mycmd", NULL, env_);

execle的第三个参数表示的是如果你想给你的程序传入对应的环境变量信息,也是一个字符指针数组,那就可以传入对应的环境变量参数,示例:

如下我们的mycmd.cpp文件:

image-20230322223653489

如上我输出的是系统PATH中的环境变量,现在我想自定义环境变量MYPATH并交给子进程,我的myexec.c程序如下:

image-20230322224210778

这里有个错误:

execle("./mycmd", "mycmd", NULL, env_);

当我make后并运行myexec可执行程序会发现有个问题:

image-20230322224342685

当我自定义一个环境变量时,运行myexec,我PATH环境变量就输出不了了,当我把mycmd.cpp中的PATH语句那块给注释掉,再运行myexec,此时就能看到我自定义的环境变量MYPATH了:

image-20230322225235790

为什么我把PATH的注释取消了,却输出不了我的PATH环境变量?相反的,把PATH注释掉才能打印我的MYPATH?

  • 根本原因:自己添加环境变量给目标进程,是覆盖式的!!!

解决办法如下:

使用environ(系统环境变量的指针声明),利用export将MYPATH添加到系统环境变量中:

image-20230322225930075

6、execve

int execve(const char *filename, char *const argv[], char *const envp[]);
  • 第一个参数是要执行程序的路径
  • 第二个参数是一个指针数组,表示你要如何执行这个程序,数组以NULL结尾
  • 第三个参数是你自己设置的环境变量

例如,你设置了MYPATH环境变量,在myexec程序内部就可以使用该环境变量:

char* my_argv[] = { "myexec", NULL };
char* my_envp[] = { "MYPATH=helloWorld", NULL };
execve("./myexec", my_argv, my_envp);

7、execvpe

int execvpe(const char *file, char *const argv[], char *const envp[]);
  • 第一个参数是要执行程序的路径
  • 第二个参数是一个指针数组,表示你要如何执行这个程序,数组以NULL结尾
  • 第三个参数是你自己设置的环境变量

此替换函数在我们前面讲解的基础上,已经不难理解了,就不给出测试用例了。

问:为什么会有这么多接口?execve为什么是单独的?

  • 其实替换函数一共有7个,只不过execve是单独的:

有多个接口的原因在于调用替换函数的场景各不相同,所以有不同的接口,execve是单独的原因其实我在命名理解那也说明了,这里再强调下:

  • 事实上,只有execve是真正的系统调用,其它五个函数最终都是调用的execve,所以execve在man手册的第2节,其它五个函数在man手册的第3节,也就是说其它五个函数实际上是对系统调用execve进行了封装,以满足不同用户的不同调用场景的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/3103.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

为什么 ChatGPT 输出时经常会中断,需要输入“继续” 才可以继续输出?

作者&#xff1a;明明如月学长&#xff0c; CSDN 博客专家&#xff0c;蚂蚁集团高级 Java 工程师&#xff0c;《性能优化方法论》作者、《解锁大厂思维&#xff1a;剖析《阿里巴巴Java开发手册》》、《再学经典&#xff1a;《EffectiveJava》独家解析》专栏作者。 热门文章推荐…

树莓派Pico开发板I2C OLED显示模块接口与MicroPython编程

首先简要介绍I2C接口及I2C接口OLED显示模块&#xff0c;然后讲述Pico开发板I2C总线引脚及其与I2C总线OLED SSD1306显示模块的接口原理&#xff0c;最后给出Pico开发板控制OLED屏显示文字/图形的MicroPython程序实例。 一、I2C接口简介 I2C/IIC/I2C&#xff08;Inter-Integrated…

Linux内核Socket通信原理和实例讲解

关于对 Socket 的认识&#xff0c;大致分为下面几个主题&#xff0c;Socket 是什么&#xff0c;Socket 是如何创建的&#xff0c;Socket 是如何连接并收发数据的&#xff0c;Socket 套接字的删除等。Socket 是什么以及创建过程一个数据包经由应用程序产生&#xff0c;进入到协议…

平板触控笔哪些品牌好?ipad触控笔推荐平价

苹果电容笔与平替电容笔两者需要根据我们的预算以及需求去选择&#xff0c;要是日常多用于用于绘画&#xff0c;建议可以用Apple Pencil&#xff0c;而对于日常仅仅用于学习与记笔记&#xff0c;可以用平替电容笔&#xff0c;由于平替电容笔的品质与表现都非常优秀。小编整理了…

初识进程

文章目录一、进程的概念1. 进程是什么及进程的管理2. Linux 下的 pcb3. 系统调用接口 getpid 和 getppid4. 系统调用接口 fork一、进程的概念 1. 进程是什么及进程的管理 在 Linux下 ./binaryfile 运行一个程序或者在 Windows下双击运行一个程序时&#xff0c;程序就变成了一个…

【百面成神】spring基础12问,你能坚持到第几问

前 言 &#x1f349; 作者简介&#xff1a;半旧518&#xff0c;长跑型选手&#xff0c;立志坚持写10年博客&#xff0c;专注于java后端 ☕专栏简介&#xff1a;java面试宝典&#xff0c;特点&#xff1a;全、精、深、简&#xff0c;力求每个核心知识点1分钟回答好。 &#x1f3…

RK3588平台开发系列讲解(视频篇)RTP H264 码流打包详解

平台内核版本安卓版本RK3588Linux 5.10Android 12文章目录 一、单 NALU 封包方式二、组合封包方式三、分片封包方式沉淀、分享、成长,让自己和他人都能有所收获!😄 📢 H264 码流是放在 RTP 的有效载荷部分的。因此有效载荷前面的 RTP 头部跟码流本身是没有关系的,所以我…

Python|蓝桥杯进阶第六卷——搜索

欢迎交流学习~~ 专栏&#xff1a; 蓝桥杯Python组刷题日寄 蓝桥杯进阶系列&#xff1a; &#x1f3c6; Python | 蓝桥杯进阶第一卷——字符串 &#x1f50e; Python | 蓝桥杯进阶第二卷——贪心 &#x1f49d; Python | 蓝桥杯进阶第三卷——动态规划 ✈️ Python | 蓝桥杯进阶…

mysql数据库介绍

&#x1f49c;今天对mysql的一些基础概念进行讲诶横扫&#xff0c;如概念、特点、优势、发展历史等等。对之前内容感兴趣的同学可以参考&#x1f447;&#xff1a; 链接: mysql学习之数据系统概述 &#x1f3be;让我们开始今日份的学习吧&#xff01; 目录1. mysql的基本概念…

十七、网上商城项目(5)

本章概要 购物车 购物车状态管理配置购物车组件 结算页面用户管理 用户状态管理配置用户注册组件用户登录组件 17.8 购物车 在一个电商网站中&#xff0c;购物车在很多页面都需要用到&#xff0c;因此非常适合放在 Vuex 的 store 中进行集中管理。在本项目中&#xff0c;采…

【北大青鸟天府校区的Java专业怎么样?】

北大青鸟天府校区是北大青鸟总部在西南投资兴办的重点校区&#xff0c;拥有极为强大的外部教育资源和就业资源&#xff0c;使咱们的学员能够享受更好、更完善的教学资源。超过23年的办学经验&#xff0c;培养了超过10000位学员&#xff0c;保障就业&#xff0c;学员就业率达到9…

[入门必看]数据结构2.3:线性表的链式表示

[入门必看]数据结构2.3&#xff1a;线性表的链式表示第二章 线性表2.3 线性表的链式表示知识总览2.3.1 单链表的定义2.3.2_1 单链表的插入删除2.3.2_2 单链表的查找2.3.2_3 单链表的建立2.3.3 双链表2.3.4 循环链表2.3.5 静态链表2.3.6 顺序表和链表的比较2.3.1 单链表的定义单…

JUC高级四:Java内存模型之JMM

JUC高级四:Java内存模型之JMM 1. 计算机硬件存储体系(JMM为什么诞生) 因为有这么多级的缓存(cpu和物理主内存的速度不一致的)&#xff0c;CPU的运行并不是直接操作内存而是先把内存里边的数据读到缓存&#xff0c;而内存的读和写操作的时候就会造成不一致的问题 在我们cpu寄存…

WebRTC开源库内部调用abort函数引发程序发生闪退问题的排查

目录 1、初始问题描述 2、使用Process Explorer工具查看到处理音视频业务的rtcmpdll.dll模块没有加载起来 3、使用Dependency Walker工具查看到rtcmpdll.dll依赖的库有问题 4、更新库之后Debug程序启动时就发生异常&#xff0c;程序闪退 5、VS调试时看不到有效的函数调用堆…

十大Python可视化工具,太强了

今天介绍Python当中十大可视化工具&#xff0c;每一个都独具特色&#xff0c;惊艳一方。 Matplotlib Matplotlib 是 Python 的一个绘图库&#xff0c;可以绘制出高质量的折线图、散点图、柱状图、条形图等等。它也是许多其他可视化库的基础。 import matplotlib.pyplot as p…

OpenCV入门(二十)快速学会OpenCV 19 对象测量

OpenCV入门&#xff08;二十&#xff09;快速学会OpenCV 19 对象测量1.对象测量2.多边形拟合3.计算对象中心作者&#xff1a;Xiou 1.对象测量 opencv 中对象测量包括&#xff1a; 如面积&#xff0c;周长&#xff0c;质心&#xff0c;边界框等。 弧长与面积测量&#xff1b; …

《LKD3粗读笔记》(4)进程调度

1、多任务 什么是多任务操作系统&#xff1f; 能同时并发地交互执行多个进程。注意是并发而不是并行。特别地&#xff0c;在多处理机机器上可以实现真正意义上的并行&#xff0c;因为它长了多个脑子多任务操作系统有哪些分类&#xff1f; 非抢占式多任务&#xff08;cooperati…

【云原生】Kubernetes(k8s)部署 MySQL+Dubbo+Nacos服务

一、说明二、部署 MySQL三、部署 Nacos四、部署 Dubbo 服务4.1. 创建镜像仓库的密钥4.2. 部署 provider 服务4.3. 部署 consumer 服务五、测试一、说明 本文介绍基于 Kubernetes(k8s) 环境集成阿里云 私有镜像仓库 来部署一套 Dubbo Nacos 的微服务系统&#xff0c;并使用 Ku…

7个最好的PDF编辑器,帮你像编辑Word一样编辑PDF

PDF 是具有数字思维的组织的重要交流工具。提供高效的工作流程和更好的安全性&#xff0c;可以创建重要文档并与客户、同事和员工共享。文档的布局已锁定&#xff0c;因此无论在什么设备上查看&#xff0c;格式都保持不变。这是让每个人保持一致的好方法——尤其是那些使用Micr…

C++中的引用

个人主页&#xff1a;平行线也会相交 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 平行线也会相交 原创 收录于专栏【C】 接下来就要开始进行C的学习路线了&#xff0c;听说这块的内容稍微难一些&#xff0c;不过我相信只要自己好好学习&#xff0c;态度…
最新文章