《Operating Systems: Three Easy Pieces》学习笔记(三) 插叙:进程 API
fork()系统调用
在执行函数 fork()时,创建了一个子进程,此时是两个进程同时运行
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char *argv[])
{
printf("hello world (pid:%d)\n", (int)getpid());
int rc = fork();
if (rc < 0)
{ // fork failed; exit
fprintf(stderr, "fork failed\n");
exit(1);
}
else if (rc == 0)
{ // child (new process)
printf("hello, I am child (pid:%d)\n", (int)getpid());
}
else
{ // parent goes down this path (main)
printf("hello, I am parent of %d (pid:%d)\n",
rc, (int)getpid());
}
return 0;
}
输出如下:
1
2
3
4
5
prompt> ./p1
hello world (pid:29146)
hello, I am parent of 29147 (pid:29146)
hello, I am child (pid:29147)
prompt>
上面这段程序执行了一次 fork 操作,fork()
函数是一个神奇的操作,它只被调用了一次,却产生了两个返回值。对于父进程
来说,其返回值是子进程的 pid;对于子进程
来说,其返回值为 0。
子进程并不是完全拷贝
了父进程,所以子进程不会从 main 开始执行,该程序的首行打印并未被子进程执行。它拥有自己的地址空间
(即拥有自己的私有内存)、寄存器
、程序计数器
等。
此处父进程与子进程的执行顺序并不是绝对的,取决于 cpu 的调度算法,子进程也可能比父进程先执行完
TODO: fork()函数的具体原理还有待进一步学习
wait()系统调用
wait()
函数用于使父进程(也就是调用 wait()的进程)阻塞
,直到一个子进程结束
或者该进程接收到了一个指定的信号
为止。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>
int main(int argc, char *argv[])
{
printf("hello world (pid:%d)\n", (int)getpid());
int rc = fork();
if (rc < 0)
{ // fork failed; exit
fprintf(stderr, "fork failed\n");
exit(1);
}
else if (rc == 0)
{ // child (new process)
printf("hello, I am child (pid:%d)\n", (int)getpid());
}
else
{ // parent goes down this path (main)
int wc = wait(NULL);
printf("hello, I am parent of %d (wc:%d) (pid:%d)\n",
rc, wc, (int)getpid());
}
return 0;
}
1
2
3
4
5
prompt> ./p2
hello world (pid:29266)
hello, I am child (pid:29267)
hello, I am parent of 29267 (wc:29267) (pid:29266)
prompt>
本例中,子进程却优先于父进程执行完毕,这是因为父进程调用了wait()
操作
当父进程先执行时,会等待子进程结束,才会继续执行
exec()系统调用
exec()这个系统调用可以让子进程执行与父进程不同的程序
关于
exec函数族
的更多相关内容,可以查看Linux 多任务编程(三)—exec 函数族及其基础实验
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/wait.h>
int main(int argc, char *argv[])
{
printf("hello world (pid:%d)\n", (int)getpid());
int rc = fork();
if (rc < 0)
{ // fork failed; exit
fprintf(stderr, "fork failed\n");
exit(1);
}
else if (rc == 0)
{ // child (new process)
printf("hello, I am child (pid:%d)\n", (int)getpid());
char *myargs[3];
myargs[0] = strdup("wc"); // program: "wc" (word count)
myargs[1] = strdup("p3.c"); // argument: file to count
myargs[2] = NULL; // marks end of array
execvp(myargs[0], myargs); // runs word count
printf("this shouldn't print out");
}
else
{ // parent goes down this path (main)
int wc = wait(NULL);
printf("hello, I am parent of %d (wc:%d) (pid:%d)\n",
rc, wc, (int)getpid());
}
return 0;
}
1
2
3
4
5
6
prompt> ./p3
hello world (pid:29383)
hello, I am child (pid:29384)
29 107 1030 p3.c
hello, I am parent of 29384 (wc:29384) (pid:29383)
prompt>
在这个例子中,子进程调用 execvp()
来运行字符计数程序 wc。实际上,它针对源代码文件 p3.c 运行 wc,从而告诉我们该文件有多少行、多少单词,以及多少字节。
给定可执行程序的名称
(如 wc)及需要的参数
(如 p3.c)后,exec()会从可执行程序中加载代码和静态数据,并用它覆写
自己的代码段(以及静态数据),堆、栈及其他内存空间也会被重新初始化。然后操作系统就执行该程序,将参数通过 argv 传递给该进程。因此,它并没有创建新进程,而是直接将当前运行的程序(以前的 p3)替换
为不同的运行程序(wc)。子进程执行 exec()之后,几乎就像 p3.c 从未运行过一样。对 exec()的成功调用永远不会返回
。如果 exec 函数执行失败, 它会返回失败的信息, 而且进程继续执行后面的代码
。
注意:此时子进程的 pid 号并没有变,且还是该父进程的子进程,所以并不会影响 wait()操作,等待该进程的操作(统计字节)完成后,wait()才会返回,父进程同时退出阻塞状态
为什么这样设计 API
事实证明,这种分离 fork()及 exec()的做法在构建 UNIX shell
的时候非常有用,因为这给了 shell 在 fork 之后 exec 之前运行代码的机会,这些代码可以在运行新程序前改变环境,从而让一系列有趣的功能很容易实现。
shell 也是一个用户程序,它首先显示一个提示符(prompt),然后等待用户输入。你可以向它输入一个命令(一个可执行程序的名称及需要的参数),大多数情况下,shell 可以在文件系统中找到这个可执行程序,调用 fork()
创建新进程,并调用 exec()
的某个变体来执行这个可执行程序,调用 wait()
等待该命令完成。子进程执行结束后,shell 从 wait()返回并再次输出一个提示符,等待用户输入下一条命令。
fork()和 exec()的分离,让 shell 可以方便地实现很多有用的功能。比如:
1
prompt> wc p3.c > newfile.txt
在上面的例子中,wc 的输出结果被重定向(redirect)到文件 newfile.txt 中(通过 newfile.txt 之前的大于号来指明重定向)。shell 实现结果重定向的方式也很简单,当完成子进程的创建后,shell 在调用 exec()之前先关闭了标准输出(standard output),打开了文件 newfile.txt。这样,即将运行的程序 wc 的输出结果就被发送到该文件,而不是打印在屏幕上。
扩展阅读:重定向
重定向的工作原理,是基于对操作系统管理文件描述符方式的假设,首先看实例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <fcntl.h>
#include <sys/wait.h>
int main(int argc, char *argv[])
{
int rc = fork();
if (rc < 0)
{ // fork failed; exit
fprintf(stderr, "fork failed\n");
exit(1);
}
else if (rc == 0)
{ // child: redirect standard output to a file
close(STDOUT_FILENO);
open("./p4.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU);
// now exec "wc"...
char *myargs[3];
myargs[0] = strdup("wc"); // program: "wc" (word count)
myargs[1] = strdup("p4.c"); // argument: file to count
myargs[2] = NULL; // marks end of array
execvp(myargs[0], myargs); // runs word count
}
else
{ // parent goes down this path (main)
int wc = wait(NULL);
}
return 0;
}
1
2
3
4
prompt> ./p4
prompt> cat p4.output
32 109 846 p4.c
prompt>
要看懂上面的例子,首先要补充点Unix文件描述符
的知识
每个 Unix 进程(除了可能的守护进程)应均有三个标准的 POSIX 文件描述符,对应于三个标准流:
整数值 名称 <unistd.h>
符号常量<stdio.h>
文件流0 Standard input STDIN_FILENO stdin 1 Standard output STDOUT_FILENO stdout 2 Standard error STDERR_FILENO stderr
UNIX 系统从 0 开始寻找可以使用的文件描述符,进程启动后默认打开了标准输出
STDOUT_FILENO
输出到屏幕,此时所有的对标准输出文件描述符
的输出,如printf()
,都会打印的屏幕上:1 2
root@hjk:~/repo/os_test# ./a.out 33 113 864 p4.c
如果使用close(STDOUT_FILENO)关闭了这个描述符,再去调用
printf()
,系统会提示找不到文件描述符1 2
root@hjk:~/repo/os_test# ./a.out wc: write error: Bad file descriptor
此时再打开
新的文件描述符
,会将所有的对标准输出文件描述符
的输出定向到该文件描述符上1
open("./p4.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU)
因为 Unix 系统会从 0 开始寻找可用的文件描述符,当找不到
STDOUT_FILENO
自然会去找新打开的文件描述符
扩展阅读:管道
UNIX管道
也是用类似的方式实现的,但用的是 pipe()
系统调用。在这种情况下,一个进程的输出
被链接到了一个内核管道
(pipe)上(队列),另一个进程的输入
也被连接到了同一个管道上。因此,前一个进程的输出无缝地作为后一个进程的输入
,许多命令可以用这种方式串联在一起,共同完成某项任务。比如通过将 grep
、wc
命令用管道连接可以完成从一个文件中查找某个词,并统计其出现次数的功能:
1
grep -o foo file | wc -l
作业
编写一个调用 fork()的程序。在调用 fork()之前,让主进程访问一个变量(例如 x)并将其值设置为某个值(例如 100)。子进程中的变量有什么值?当子进程和父进程都改变 x 的值时,变量会发生什么?
答:父进程在 fork 之前修改的值会同步到子进程中(fork 前子进程并不存在),当 fork 完成后,两个进程相互独立,修改 fork 前定义的变量时也是独立的。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
#include <stdio.h> #include <stdlib.h> #include <unistd.h> int main(int argc, char *argv[]) { int x = 1; printf("hello world (pid:%d)\n", (int)getpid()); x = 3; int rc = fork(); if (rc < 0) { // fork failed; exit fprintf(stderr, "fork failed\n"); exit(1); } else if (rc == 0) { // child (new process) x=4; printf("hello, I am child (pid:%d),x:%d\n", (int)getpid(),x); } else { // parent goes down this path (main) wait(NULL); printf("hello, I am parent of %d (pid:%d),x:%d\n", rc, (int)getpid(),x); } return 0; }
结果如下,两个进程的 x 独立,即便是子进程修改了 x,父进程中的 x 还是 fork 前的值
1 2 3 4
root@hjk:~/repo/os_test# ./a.out hello world (pid:17699) hello, I am child (pid:17700),x:4 hello, I am parent of 17700 (pid:17699),x:3
编写一个打开文件的程序(使用 open()系统调用),然后调用 fork()创建一个新进程。子进程和父进程都可以访问 open()返回的文件描述符吗?当它们并发(即同时)写入文件时,会发生什么?
答:都可以访问。并发时无影响。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <fcntl.h> #include <sys/wait.h> int main(int argc, char *argv[]) { close(STDOUT_FILENO); int fd = open("./p4.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU); int rc = fork(); if (rc < 0) { // fork failed; exit fprintf(stderr, "fork failed\n"); exit(1); } else if (rc == 0) { // child: redirect standard output to a file // now exec "wc"... printf("child\n"); } else { // parent goes down this path (main) // int wc = wait(NULL); printf("father\n"); } // if(fd>=0) // { // close(fd); // } return 0; }
p4.output 文件输出如下:
1 2
father child
使用 fork()编写另一个程序。子进程应打印“hello”,父进程应打印“goodbye”。你应该尝试确保子进程始终先打印。你能否不在父进程调用 wait()而做到这一点呢?
答:使用 sleep 函数时父进程休眠一段时间
现在编写一个程序,在父进程中使用 wait(),等待子进程完成。wait()返回什么?如果你在子进程中使用 wait()会发生什么?
答:wait()返回子进程的 pid,子进程中调用无影响,返回值为-1。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <fcntl.h> #include <sys/wait.h> int main(int argc, char *argv[]) { close(STDOUT_FILENO); int fd = open("./p4.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU); int rc = fork(); if (rc < 0) { // fork failed; exit fprintf(stderr, "fork failed\n"); exit(1); } else if (rc == 0) { // child: redirect standard output to a file // now exec "wc"... int wc=wait(NULL); printf("child,pid:%d,wc:%d\n",getpid(),wc); } else { // parent goes down this path (main) int wc = wait(NULL); // sleep(1); printf("father,pid:%d,wc:%d\n",getpid(),wc); } // if(fd>=0) // { // close(fd); // } return 0; }
p4.output 输出结果为:
1 2
child,pid:4577,wc:-1 father,pid:4576,wc:4577
对前一个程序稍作修改,这次使用 waitpid()而不是 wait()。什么时候 waitpid()会有用?
waitpid()
参数值说明 pid<-1 等待 进程组
号为pid 绝对值
的任何子进程。pid=-1 等待 任何子进程
,此时的 waitpid()函数就退化成了普通的wait()
函数。pid=0 等待 进程组
号与目前进程相同
的任何子进程,也就是说任何和调用 waitpid()函数的进程在同一个进程组的进程。pid>0 等待 进程号
为 pid 的子进程。使用
getpgrp()
获取当前进程组号答:当 pid 为
0
(pid=0),-1
(pid=-1),child_pid
(pid>0),getpgrp()*-1
(pid<-1)时,waitpid()有用编写一个创建子进程的程序,然后在子进程中关闭标准输出(STDOUT_FILENO)。如果子进程在关闭描述符后调用 printf()打印输出,会发生什么?
答:子进程无法打印,父进程无影响
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <fcntl.h> #include <sys/wait.h> int main(int argc, char *argv[]) { // close(STDOUT_FILENO); // int fd = open("./p4.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU); int rc = fork(); if (rc < 0) { // fork failed; exit fprintf(stderr, "fork failed\n"); exit(1); } else if (rc == 0) { // child: redirect standard output to a file // now exec "wc"... // int wc=wait(NULL); close(STDOUT_FILENO); printf("child,pid:%d,wc:%d\n",getpid()); } else { // parent goes down this path (main) // int wc = waitpid(getpgrp(),NULL,0); // sleep(1); printf("father,pid:%d,wc:%d\n",getpid()); } // if(fd>=0) // { // close(fd); // } return 0; }
输出为:
1 2
root@hjk:~/repo/os_test# ./a.out father,pid:11189,wc:0
编写一个程序,创建两个子进程,并使用 pipe()系统调用,将一个子进程的标准输出连接到另一个子进程的标准输入。
答:该程序将子进程2中的输出通过管道连接到子进程1的输入中
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <fcntl.h> #include <sys/wait.h> int main(int argc, char *argv[]) { // close(STDOUT_FILENO); // int fd = open("./p4.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU); int fds[2]; if(pipe(fds)==-1) { fprintf(stderr, "open pipe failed\n"); exit(1); } int rc = fork(); if (rc < 0) { // fork failed; exit fprintf(stderr, "fork failed\n"); exit(1); } else if (rc == 0) { // child: redirect standard output to a file // int wc=wait(NULL); printf("child1,pid:%d\n",getpid()); int len; char buf[10]; // 从pipe中读取 if((len=read(fds[0],buf,6))==-1) { perror("read from pipe"); exit(1); } printf("buf:%s\n",buf); exit(0); } else { // parent goes down this path (main) // wait(NULL); //创建第二个子进程 int rc2 = fork(); if (rc2 < 0) { // fork failed; exit fprintf(stderr, "fork failed\n"); exit(1); } else if (rc2 == 0) { // child: redirect standard output to a file // int wc=wait(NULL); printf("child2,pid:%d\n",getpid()); char buf[]= "12345"; // 写入pipe if(write(fds[1],buf,sizeof(buf))!=sizeof(buf)) { perror("write to pipe"); exit(1); } exit(0); } } return 0; }
补充:有趣的小知识
在做作业时发现,有时子进程打印的结果会在shell显示提示符
后才打印出来,如下:
1
2
3
root@hjk:~/repo/os_test# ./a.out
father,pid:92505
root@hjk:~/repo/os_test# child,pid:92506
在本文的[为什么这样设计 API]
一节中有提到shell执行程序的逻辑,下面解释下:
- shell 也是一个用户程序,它首先显示一个提示符(prompt)
- 运行程序时shell进程会fork一个子进程
- 子进程使用exec替换程序为要执行的程序,如a.out
- 此时shell进入wait状态,直到子进程退出
- 由于作业中编写的程序又创建了一个子进程,如果父进程先执行完,那么对于shell进程来说,它的子进程就已经结束了,shell结束wait状态,打印一行提示符。此时用户进程的子进程还未结束,又继续在标准输出上打印了信息,那就会有这种现象