线程与进程

进程和线程简单而基本靠谱的定义如下：

1. 进程：程序的一次执行

2. 线程：CPU的基本调度单位

这两个概念虽然过于简单，但是完全可以为理解OS/线程/进程打下坚实的基础，我认为关于进程/线程的探讨，无论采用何种方式，都必须以这两句话为落脚点，才算靠谱。本质上讲，进程的内存空间是天然独立的，线程的内存空间是天然共享的。

进程是系统权限的集合。进程是资源调度，线程是执行调度。

线程是 CPU 调度的最小单位。

在CPU看来，所有的任务都是一个一个轮流执行的，一个任务可以被CPU执行，说明它所申请的除了CPU以外的所有资源，都已经获得。这里除了CPU以外的所有资源构成程序的执行环境，也称为程序的上下文。

一个进程的处理过程是：加载上下文—>CPU执行—>保存上下文

进程的切换，也是同样的处理过程，每次都要加载上下文和保存上下文。这样每次的调入、调出，对系统来说，是会造成一定的开销的。于是就引入了“线程”这个概念，一个进程可以分为一个或多个线程，这些线程共享一样的上下文，也就是说，属于同一个进程的线程之间的切换，就少了加载/保存上下文，开销减少，效率就提高了。

进程是资源分配的最小单位，在没有引入线程以前，进程既是最小资源分配单位，也是最小调度单位。后来引入了线程，最小调度单位就是线程，资源分配和调度分开了，目的是为了更好的利用CUP。

抛开各种技术细节，从应用程序角度讲：

1、在单核计算机里，有一个资源是无法被多个程序并行使用的：cpu。

没有操作系统的情况下，一个程序一直独占着全都cpu。

如果要有两个任务来共享同一个CPU，程序员就需要仔细地为程序安排好运行计划--某时刻cpu和由程序A来独享，下一时刻cpu由程序B来独享

而这种安排计划后来成为OS的核心组件，被单独名命为“scheduler”，即“调度器”，它关心的只是怎样把单个cpu的运行拆分成一段一段的“运行片”，轮流分给不同的程序去使用，而在宏观上，因为分配切换的速度极快，就制造出多程序并行在一个cpu上的假象。

2、在单核计算机里，有一个资源可以被多个程序共用，然而会引出麻烦：内存。

在一个只有调度器，没有内存管理组件的操作系统上，程序员需要手工为每个程序安排运行的空间 -- 程序A使用物理地址0x00-0xff,程序B使用物理地址0x100-0x1ff，等等。

然而这样做有个很大的问题：每个程序都要协调商量好怎样使用同一个内存上的不同空间，软件系统和硬件系统千差万别，使这种定制的方案没有可行性。

为了解决这个麻烦，计算机系统引入了“虚拟地址”的概念，从三方面入手来做：

2.1、硬件上，CPU增加了一个专门的模块叫MMU，负责转换虚拟地址和物理地址。

2.2、操作系统上，操作系统增加了另一个核心组件：memory management，即内存管理模块，它管理物理内存、虚拟内存相关的一系列事务。

2.3、应用程序上，发明了一个叫做【进程】的模型，（注意）每个进程都用【完全一样的】虚拟地址空间，然而经由操作系统和硬件MMU协作，映射到不同的物理地址空间上。不同的【进程】，都有各自独立的物理内存空间，不用一些特殊手段，是无法访问别的进程的物理内存的。

3、现在，不同的应用程序，可以不关心底层的物理内存分配，也不关心CPU的协调共享了。然而还有一个问题存在：有一些程序，想要共享CPU，【并且还要共享同样的物理内存】，这时候，一个叫【线程】的模型就出现了，它们被包裹在进程里面，在调度器的管理下共享CPu，拥有同样的虚拟地址空间，同时也共享同一个物理地址空间，然而，它们无法越过包裹自己的进程，去访问别一个进程的物理地址空间。

4、进程之间怎样共享同一个物理地址空间呢？不同的系统方法各异，符合posix规范的操作系统都提供了一个接口，叫mmap，可以把一个物理地址空间映射到不同的进程中，由不同的进程来共享。

5、PS：在有的操作系统里，进程不是调度单位（即不能被调度器使用），线程是最基本的调度单位，调度器只调度线程，不调度进程，比如VxWorks

文档仍然说到：Threads are scheduled globally across all processes.即调度的基本单位是线程，不是进程。调度器在调度任务时，只知道线程，不知道进程这个东西，对于进程的管理，是OS别的组件的事情。