Fork三部曲之clone的诞生

本文是fork三部曲的后续篇,建议先阅读:

正传:《Linux fork那些隐藏的开销》
前传:《Unix/Linux fork前传》
在本文中,我将介绍传统UNIX fork在Linux内核中的变体——clone系统调用的精彩之处。


若要理解fork的原始意义,我们需要回顾Melvin Conway提出fork思想的原始论文 A Multiprocessor System Design

https://www./link/5e27fa9f1e017d329261a023f2400ce1
该论文的核心在于Conway分离了 “进程(process)”“处理器(processor)” 的概念:

一个进程不必特定于一个处理器上被处理。一个处理器未必处理特定的进程。系统中进程数量和处理器数量不需要相等。fork为上述的核心思想提供了实现的手段。后来fork被引入到UNIX系统,成了创建新进程几十年不变的通用操作。

有趣的是,UNIX fork因其著名的fork-exec序列而闻名,而不是因为其提供的并行多处理手段而闻名。这可能是因为在线程概念出现以后,并行处理主要由线程担当,导致人们逐渐忘记了fork的作用。

我们来看看在线程出现之前,fork提供的并行多处理是多么高效。最典型的例子就是TCP服务编程模型:

代码语言:javascript
代码运行次数:0

运行 复制 ```javascript void handle_request(int csd){ // 读取请求 ret = recv(csd, buf_req, len); ret = read(fd, buf_tosend, ret); ret = send(csd, buf_tosend, ret); close(csd); }

void server(int sd){ // ... while (1) { csd = accept(sd, 10); if (fork() == 0) { close(sd); handle_request(csd); // 可并行处理 } } }


这几乎成了服务器编程的典范,是理解和设计select/poll/epoll程序的前提,也是理解后来Apache Web Server以及Nginx的基础。