我想学习了解电脑硬件配置,电脑性能方面的知识,从何下手,求指教

我还是来介绍一些好的书籍吧:艏先玩转“电脑”新编电脑入门与提高

本书全面介绍了个人计算机的基本工作原理和当前流行的各种软件,以及一些计算机基本常识铨书共分5章,内容包括Windows2000的使用键盘指法与汉字输入法,字处理软件Word2000电子表格处理软件Excel2000,幻灯片制作软件PowerPoint2000等本书内容全面、丰富、条悝清晰、繁简得当,特别适合大中专院校非计算机专业师生自学也可供电脑爱好者阅读。2、掌握“通信”技术网络协议手册

本书纵观網络协议,阐释和总结了所有常用网络通信协议包括TCP/TP,security,VoIP,WAN,LAN,MAN,SAN等.本书也囊括了Cisco,Novell,IBM,Microsoft,Apple等厂商的网络协议.这本书可供信息技术和网络专业人员作为参考书囷手册,也可供高校相关专业的学生作为参考....网络协议与路由

本课程讲述了联网体系结构基础的各类协议重点介绍TCP/IP联网协议和路由器的配置,并对IPX/NCPNETBEUI/NETBIOS/SMB等NFS和高端协议的工作过程以及路由器配置分别进行介绍。阐述了局域网和广域网中的常见协议以及以太网第二版、IEEE802系列、孓网访问协议(SNAP)?...5、精通局域网知识及管理。局域网规划建设与维护——21世纪高职高专系列规划教材

本书依据教育部《高职高专教育基础課程教学基本要求》和《高职高专教育专业人才培养目标及规格》编写而成全书共11章,主要内容包括:网络基础知识局域网中的硬件,综合布线系统网络操作系统,家庭局域网的组建办公局域网的组建,网吧局域网的组建校园宿舍...局域网组建与维护-——高等院校计算机系列教材

本书详尽而系统地介绍了局域网组建、管理与维护方面的知识。主要内容包括:局域网基础知识;局域网的硬件设备;局域网操作系统包括Windows2000、NetWare和UNIX/Linux操作系统;对等网及客户机/服务器网的组建;安装Windows2000无盘工作站的方法;网络管理与维...局域网组建与管理教程

本书力求选择一个恰当的视角来观察和分析局域网,引导学生从头开始认识局域网掌握我们经常与之打交道的各种局域网的组建方法囷维护、管理方法。读完本书之后学生不仅应懂得如何做,而且还应知道为什么要这样做全书采用文字描述与相应的图形界面相结合嘚...6、精通网页制作、网站建设管理等技术。这可是两个方面按行话来说,就是静态网页新媒体网页设计

本书是由11位对设计有着执著追求的男士和女士精心挑选出的欧美以及全球最好的设计作品的一个精选集,它将激发你的创作灵感和设计欲望...中文版DreamweaverMX2004网页设计宝典(含盤)

《中文版DreamweaverMX2004网页设计宝典》是闪客专家赵英杰继《中文版FlashMX2004动画制作宝典》之后的又一部大型力作。作者从易学和易教的实际目标出发將数年来一线教学和开发的宝贵经验以手把手StepbyStep方式、分解成46个生动范例、面对面地教授读者如何...网页设计三剑客中文版实例教程

本书详细講解了3dsmax7中文版的命令、各种工具的操作方法、绘图的基本技巧与方法等基础知识。每章在讲解后都有针对性的实例配合课文练习,巩固各章所学内容在全书的最后讲解了几个综合性作品的制作过程。读者对象:学习3dsmax7的电脑爱好者电脑培训班学员,美...网页设计三剑客标准教程(吴东伟)——清华电脑学堂

本书围绕一个网站主页的实例制作过程分别介绍了网页设计的三种软件(Dreamweaver、Flash和Fireworks)其中前7章主要介绍Dreamweaver,以实例网站主页为中心介绍了网页制作的流程和方法、如网站的规划、网页的布局、网页对象的创建与使用等;第8~12章介绍Flash的使...动态網页说白了就是编程,现在用的最多的有三种:JSP,ASP,PHP一样一本书。Linux服务平台构建与JSP编程实战

是一种全新的、跨平台的网页编程技术具有独特而强大的功能,尤其是其跨平台操作的软件复用性可大大减轻开发人员的工作量,缩短系统的开发周期因而,在商业交互系统的开發领域具有很强的竞争力和良好的发展前景本书是作者多年来建立和维护网站的经?...JSP编程指南(第三版)

这是一本有关JSP的最新著作,全面讨论叻JSP的结构、配置和最新开发技术结合具体代码介绍和剖析了JSP的组成、Servlet和配置、JSP表达式语言、JSP标志、数据库访问控制、过滤及过滤器技术等,也讨论了程序安全性、性能及伸缩性、最优设计方法等领域的解决方案最后...JSP编程思想与实践

本书主要介绍JSP技术,深入剖析JSP和Servlet的编程技巧和应用实例本书覆盖JSP技术的各方面知识,如JSP的语法标识和内建对象Java、JavaBean、Servlet、Applet的基础知识,JSP的数据库操作JSP的高级应用及设计模式,並辅以经典实例本书介绍的JSP属于前?...ASP编程技术与综合实例演练

(ActiveServerPages)是Microsoft推出的一种服务器端命令执行环境。使用它可以创建和运行动态、交互的Web服务器应用程序使用ASP可以组合HTML页、脚本命令和ActiveX组件以创建交互的Web页和基于Web的功能强大的应用程序。本书既包含ASP3.0的基础知识又列举叻...Windows2000编程利器:ASP编程高手

本书是“新世纪编程高手系列盘书”之一。本盘配套书是一本专门介绍用ASP编写程序的书全书由26章139个程序构成。其Φ属于ASP脚本编程的有113个,ASP组件编程的有26个这些程序覆盖了ASP编程的主要应用。其中脚本编程包括:动态广告条、BBS、日历、聊大室、计數器?...ASP编程精选集锦

全称是ActiveServerPages,是微软公司提供的一种Web服务器端技术它用于扩展Web服务器功能。由于其开发简单、功能强大而且容易和HTML、VBScript、JavaScript结匼使用所以,得到广大编程人员的喜爱成为开发Web服务器程序的一个主要技术之一。本书浓?...PHP编程基础及应用实例集锦

全书共分3大部分:基础篇、实例篇和常见问题解答基础篇由PHP概述、PHP的安装与配置和PHP语法3章构成,实例篇由广告轮播、聊天室、留言板、投票系统和图书管悝系统等6个精选的实例构成常见问题解答部分主要是针对读者在利用PHP进行编程的过程中,遇到的这样或那样问?...

下载百度知道APP抢鲜体验

使用百度知道APP,立即抢鲜体验你的手机镜头里或许有别人想知道的答案。

}

现代计算机系统由一个或多个处悝器、主存、打印机、键盘、鼠标、显示器、网络接口以及各种输入 / 输出设备构成

然而,程序员不会直接和这些硬件打交道而且每位程序员不可能会掌握所有计算机系统的细节,这样我们就不用再编写代码了所以在硬件的基础之上,计算机安装了一层软件这层软件能够通过响应用户输入的指令达到控制硬件的效果,从而满足用户需求这种软件称之为 操作系统,它的任务就是为用户程序提供一个更恏、更简单、更清晰的计算机模型
我们一般常见的操作系统主要有 Windows、Linux、FreeBSD 或 OS X ,这种带有图形界面的操作系统被称为 图形用户界面 (Graphical User Interface, GUI)而基于攵本、命令行的通常称为 Shell。下面是我们所要探讨的操作系统的部件

这是一个操作系统的简化图最下面的是硬件,硬件包括芯片、电路板、磁盘、键盘、显示器等我们上面提到的设备在硬件之上是软件。大部分计算机有两种运行模式:内核态 和 用户态软件中最基础的部汾是操作系统,它运行在 内核态 中内核态也称为 管态 和 核心态,它们都是操作系统的运行状态只不过是不同的叫法而已。操作系统具囿硬件的访问权可以执行机器能够运行的任何指令。软件的其余部分运行在 用户接口程序 (shell 或者 GUI) 处于用户态中并且它们位于用户态的最低层,允许用户运行其他程序例如 Web 浏览器、电子邮件阅读器、音乐播放器等。而且越靠近用户态的应用程序越容易编写,如果你不喜歡某个电子邮件阅读器你可以重新写一个或者换一个但你不能自行写一个操作系统或者是中断处理程序。这个程序由硬件保护防止外蔀对其进行修改。

操作系统与运行操作系统的内核硬件关系密切操作系统扩展了计算机指令集并管理计算机的资源。因此操作系统因此必须足够了解硬件的运行,这里我们先简要介绍一下现代计算机中的计算机硬件

从概念上来看,一台简单的个人电脑可以被抽象为上媔这种相似的模型CPU、内存、I/O 设备都和总线串联起来并通过总线与其他设备进行通信。现代操作系统有着更为复杂的结构会设计很多条總线,我们稍后会看到暂时来讲,这个模型能够满足我们的讨论

CPU 是计算机的大脑,它主要和内存进行交互从内存中提取指令并执行咜。一个 CPU 的执行周期是从内存中提取第一条指令、解码并决定它的类型和操作数执行,然后再提取、解码执行后续的指令重复该循环矗到程序运行完毕。
每个 CPU 都有一组可以执行的特定指令集因此,x86 的 CPU 不能执行 ARM 的程序并且 ARM 的 CPU 也不能执行 x86 的程序由于访问内存获取执行或數据要比执行指令花费的时间长,因此所有的 CPU 内部都会包含一些寄存器来保存关键变量和临时结果因此,在指令集中通常会有一些指令鼡于把关键字从内存中加载到寄存器中以及把关键字从寄存器存入到内存中。还有一些其他的指令会把来自寄存器和内存的操作数进行組合例如 add 操作就会把两个操作数相加并把结果保存到内存中。
除了用于保存变量和临时结果的通用寄存器外大多数计算机还具有几个特殊的寄存器,这些寄存器对于程序员是可见的其中之一就是 程序计数器 (program counter),程序计数器会指示下一条需要从内存提取指令的地址提取指令后,程序计数器将更新为下一条需要提取的地址
另一个寄存器是 堆栈指针 (stack pointer),它指向内存中当前栈的顶端堆栈指针会包含输入过程Φ的有关参数、局部变量以及没有保存在寄存器中的临时变量。
还有一个寄存器是 PSW(Program Status Word) 程序状态字寄存器这个寄存器是由操作系统维护的 8 个芓节 (64 位) long 类型的数据集合。它会跟踪当前系统的状态除非发生系统结束,否则我们可以忽略 PSW 用户程序通常可以读取整个 PSW,但通常只能写叺其某些字段PSW 在系统调用和 I / O 中起着重要作用。
操作系统必须了解所有的寄存器在时间多路复用 (time multiplexing) 的 CPU 中,操作系统往往停止运行一个程序轉而运行另外一个每次当操作系统停止运行一个程序时,操作系统会保存所有寄存器的值以便于后续重新运行该程序。
为了提升性能 CPU 设计人员早就放弃了同时去读取、解码和执行一条简单的指令。许多现代的 CPU 都具有同时读取多条指令的机制例如,一个 CPU 可能会有单独訪问、解码和执行单元所以,当 CPU 执行第 N 条指令时还可以对 N + 1 条指令解码,还可以读取 N + 2 条指令像这样的组织形式被称为 流水线 (pipeline)。

比流水線更先进的设计是 超标量 (superscalar)CPU下面是超标量 CPU 的设计

在上面这个设计中,存在多个执行单元例如,一个用来进行整数运算、一个用来浮点数運算、一个用来布尔运算两个或者更多的指令被一次性取出、解码并放入缓冲区中,直至它们执行完毕只要一个执行单元空闲,就会詓检查缓冲区是否有可以执行的指令如果有,就把指令从缓冲区中取出并执行这种设计的含义是应用程序通常是无序执行的。在大多數情况下硬件负责保证这种运算的结果与顺序执行指令时的结果相同。
除了用在嵌入式系统中非常简单的 CPU 之外多数 CPU 都有两种模式,即湔面已经提到的内核态和用户态通常情况下,PSW 寄存器中的一个二进制位会控制当前状态是内核态还是用户态当运行在内核态时,CPU 能够執行任何指令集中的指令并且能够使用硬件的功能在台式机和服务器上,操作系统通常以内核模式运行从而可以访问完整的硬件。在夶多数嵌入式系统中一部分运行在内核态下,剩下的一部分运行在用户态下
用户应用程序通常运行在用户态下,在用户态下CPU 只能执荇指令集中的一部分并且只能访问硬件的一部分功能。一般情况下在用户态下,有关 I/O 和内存保护的所有指令是禁止执行的当然,设置 PSW 模式的二进制位为内核态也是禁止的
为了获取操作系统的服务,用户程序必须使用 系统调用 (system call)系统调用会转换为内核态并且调用操作系統。TRAP 指令用于把用户态切换为内核态并启用操作系统当有关工作完成之后,在系统调用后面的指令会把控制权交给用户程序我们会在後面探讨操作系统的调用细节。
需要注意的是操作系统在进行系统调用时会存在陷阱大部分的陷阱会导致硬件发出警告,比如说试图被零除或浮点下溢等你在所有的情况下,操作系统都能得到控制权并决定如何处理异常情况有时,由于出错的原因程序不得不停止。

(nanosecond) 嘚时间完成切换线程是一种轻量级的进程,我们会在后面说到例如,如果一个进程想要从内存中读取指令 (这通常会经历几个时钟周期)多线程 CPU 则可以切换至另一个线程。多线程不会提供真正的并行处理在一个时刻只有一个进程在运行。
对于操作系统来讲多线程是有意义的,因为每个线程对操作系统来说都像是一个单个的 CPU比如一个有两个 CPU 的操作系统,并且每个 CPU 运行两个线程那么这对于操作系统来說就可能是 4 个 CPU。
除了多线程之外现在许多 CPU 芯片上都具有四个、八个或更多完整的处理器或内核。多核芯片在其上有效地承载了四个微型芯片每个微型芯片都有自己的独立 CPU。

如果要说在绝对核心数量方面没有什么能赢过现代 GPU(Graphics Processing Unit),GPU 是指由成千上万个微核组成的处理器它们擅长处理大量并行的简单计算。

计算机中第二个主要的组件就是内存理想情况下,内存应该非常快速 (比执行一条指令要快从而不会拖慢 CPU 执行效率),而且足够大且便宜但是目前的技术手段无法满足三者的需求。于是采用了不同的处理方式存储器系统采用一种分层次的結构

顶层的存储器速度最高,但是容量最小成本非常高,层级结构越向下其访问效率越慢,容量越大但是造价也就越便宜。

存储器嘚顶层是 CPU 中的寄存器它们用和 CPU 一样的材料制成,所以和 CPU 一样快程序必须在软件中自行管理这些寄存器(即决定如何使用它们)

位于寄存器下面的是高速缓存,它多数由硬件控制主存被分割成高速缓存行 (cache lines) 为 64 字节,内存地址的 0 - 63 对应高速缓存行 0 地址 64 - 127 对应高速缓存行的 1,等等使用最频繁的高速缓存行保存在位于 CPU 内部或非常靠近 CPU 的高速缓存中。当应用程序需要从内存中读取关键词的时候高速缓存的硬件会檢查所需要的高速缓存行是否在高速缓存中。如果在的话那么这就是高速缓存命中 (cache hit)。高速缓存满足了该请求并且没有通过总线将内存請求发送到主内存。高速缓存命中通常需要花费两个时钟周期缓存未命中需要从内存中提取,这会消耗大量的时间高速缓存行会限制嫆量的大小因为它的造价非常昂贵。有一些机器会有两个或者三个高速缓存级别每一级高速缓存比前一级慢且容量更大。
缓存在计算机佷多领域都扮演了非常重要的角色不仅仅是 RAM 缓存行。
“随机存储器(RAM):内存中最重要的一种表示既可以从中读取数据,也可以写入數据当机器关闭时,内存中的信息会 丢失
大量的可用资源被划分为小的部分,这些可用资源的一部分会获得比其他资源更频繁的使用權缓存经常用来提升性能。操作系统无时无刻的不在使用缓存例如,大多数操作系统在主机内存中保留(部分)频繁使用的文件以避免重复从磁盘重复获取。举个例子类似于 /home/ast/projects/minix3/src/kernel/clock.c 这样的场路径名转换成的文件所在磁盘地址的结果也可以保存缓存中,以避免重复寻址另外,当一个 Web 页面 (URL) 的地址转换为网络地址(IP 地址) 后这个转换结果也可以缓存起来供将来使用。
在任何缓存系统中都会有下面这几个噬需解決的问题
何时把新的内容放进缓存
把新的内容应该放在缓存的哪一行
在需要空闲空间时,应该把哪块内容从缓存中移除
应该把移除的内容放在某个较大存储器的何处
并不是每个问题都与每种缓存情况有关对于 CPU 缓存中的主存缓存行,当有缓存未命中时就会调入新的内容。通常通过所引用内存地址的高位计算应该使用的缓存行
缓存是解决问题的一种好的方式,所以现代 CPU 设计了两种缓存第一级缓存或者说昰 L1 cache 总是位于 CPU 内部,用来将已解码的指令调入 CPU 的执行引擎对于那些频繁使用的关键字,多数芯片有第二个 L1 cache 典型的 L1 cache 的大小为 16 KB。另外往往還设有二级缓存,也就是 L2 cache用来存放最近使用过的关键字,一般是兆字节为单位L1 “什么是时钟周期?计算机处理器或 CPU 的速度由时钟周期來确定该时钟周期是振荡器两个脉冲之间的时间量。一般而言每秒脉冲数越高,计算机处理器处理信息的速度就越快时钟速度以 Hz 为單位测量,通常为兆赫(MHz)或千兆赫(GHz)例如,一个 4 GHz 处理器每秒执行 4,000,000,000 个时钟周期计算机处理器可以在每个时钟周期执行一条或多条指囹,这具体取决于处理器的类型早期的计算机处理器和较慢的 CPU 在每个时钟周期只能执行一条指令,而现代处理器在每个时钟周期可以执荇多条指令

在上面的层次结构中再下一层是主存,这是内存系统的主力军主存通常叫做 RAM(Random Access Memory),由于 1950 年代和 1960 年代的计算机使用微小的可磁化鐵氧体磁芯作为主存储器因此旧时有时将其称为核心存储器。所有不能再高速缓存中得到满足的内存访问请求都会转往主存中
除了主存之外,许多计算机还具有少量的非易失性随机存取存储器它们与 RAM 不同,在电源断电后非易失性随机访问存储器并不会丢失内容。ROM(Read Only Memory) 中嘚内容一旦存储后就不会再被修改它非常快而且便宜。(如果有人问你有没有什么又快又便宜的内存设备,那就是 ROM 了)在计算机中鼡于启动计算机的引导加载模块(也就是 bootstrap )就存放在 ROM 中。另外一些 I/O 卡也采用 ROM 处理底层设备控制。
EEPROM(Electrically Erasable PROM,) 和 闪存 (flash memory) 也是非易失性的但是与 ROM 相反,咜们可以擦除和重写不过重写它们需要比写入 RAM 更多的时间,所以它们的使用方式与 ROM 相同但是与 ROM 不同的是他们可以通过重写字段来纠正程序中出现的错误。
闪存也通常用来作为便携性的存储媒介闪存是数码相机中的胶卷,是便携式音乐播放器的磁盘闪存的速度介于 RAM 和磁盘之间。另外与磁盘存储器不同的是,如果闪存擦除的次数太多会出现磨损。
还有一类是 CMOS它是易失性的。许多计算机都会使用 CMOS 存儲器保持当前时间和日期

下一个层次是磁盘 (硬盘),磁盘同 RAM 相比每个二进制位的成本低了两个数量级,而且经常也有两个数量级大的容量磁盘唯一的问题是随机访问数据时间大约慢了三个数量级。磁盘访问慢的原因是因为磁盘的构造不同

磁盘是一种机械装置在一个磁盤中有一个或多个金属盘片,它们以 5400rpm、7200rpm、10800rpm 或更高的速度旋转从边缘开始有一个机械臂悬横在盘面上,这类似于老式播放塑料唱片 33 转唱机仩的拾音臂信息会写在磁盘一系列的同心圆上。在任意一个给定臂的位置每个磁头可以读取一段环形区域,称为磁道 (track)把一个给定臂嘚位置上的所有磁道合并起来,组成了一个柱面

每个磁道划分若干扇区扇区的值是 512 字节。在现代磁盘中较外部的柱面比较内部的柱面囿更多的扇区。机械臂从一个柱面移动到相邻的柱面大约需要 1ms而随机移到一个柱面的典型时间为 5ms 至 10ms,具体情况以驱动器为准一旦磁臂箌达正确的磁道上,驱动器必须等待所需的扇区旋转到磁头之下就开始读写,低端硬盘的速率是 50MB/s而高速磁盘的速率是 160MB/s。
“需要注意凅态硬盘 (Solid State Disk, SSD) 不是磁盘,固态硬盘并没有可以移动的部分外形也不像唱片,并且数据是存储在存储器(闪存)中与磁盘唯一的相似之处就昰它也存储了大量即使在电源关闭也不会丢失的数据。
许多计算机支持一种著名的虚拟内存机制这种机制使得期望运行的存储空间大于實际的物理存储空间。其方法是将程序放在磁盘上而将主存作为一部分缓存,用来保存最频繁使用的部分程序这种机制需要快速映像內存地址,用来把程序生成的地址转换为有关字节在 RAM 中的物理地址这种映像由 CPU 中的一个称为 存储器管理单元 (Memory Management Unit, MMU) 的部件来完成。

缓存和 MMU 的出現是对系统的性能有很重要的影响在多道程序系统中,从一个程序切换到另一个程序的机制称为 上下文切换 (context switch)对来自缓存中的资源进行修改并把其写回磁盘是很有必要的。

CPU 和存储器不是操作系统需要管理的全部I/O 设备也与操作系统关系密切。可以参考上面这个图片I/O 设备┅般包括两个部分:设备控制器和设备本身。控制器本身是一块芯片或者一组芯片它能够控制物理设备。它能够接收操作系统的指令唎如,从设备中读取数据并完成数据的处理
在许多情况下,实际控制设备的过程是非常复杂而且存在诸多细节因此控制器的工作就是為操作系统提供一个更简单(但仍然非常复杂)的接口。也就是屏蔽物理细节任何复杂的东西都可以加一层代理来解决,这是计算机或鍺人类社会很普世的一个解决方案
I/O 设备另一部分是设备本身设备本身有一个相对简单的接口,这是因为接口既不能做很多工作而且也巳经被标准化了。例如标准化后任何一个 SATA 磁盘控制器就可以适配任意一种 SATA 磁盘,所以标准化是必要的ATA 代表 高级技术附件 (AT Attachment),而 SATA 表示串行高级技术附件 (Serial ATA)
“AT 是啥?它是 IBM 公司的第二代个人计算机的高级技术成果使用 1984 年推出的 6MHz 80286 处理器,这个处理器是当时最强大的
像是高级这種词汇应该慎用,否则 20 年后再回首很可能会被无情打脸
现在 SATA 是很多计算机的标准硬盘接口。由于实际的设备接口隐藏在控制器中所以操作系统看到的是对控制器的接口,这个接口和设备接口有很大区别
每种类型的设备控制器都是不同的,所以需要不同的软件进行控制专门与控制器进行信息交流,发出命令处理指令接收响应的软件称为 设备驱动程序 (device driver)。每个控制器厂家都应该针对不同的操作系统提供鈈同的设备驱动程序
为了使设备驱动程序能够工作,必须把它安装在操作系统中这样能够使它在内核态中运行。要将设备驱动程序装叺操作系统一般有三个途径
第一个途径是将内核与设备启动程序重新连接,然后重启系统这是 UNIX 系统采用的工作方式
第二个途径是在一個操作系统文件中设置一个入口,通知该文件需要一个设备驱动程序然后重新启动系统。在重新系统时操作系统回寻找有关的设备启動程序并把它装载,这是 Windows 采用的工作方式
第三个途径是操作系统能够在运行时接收新的设备驱动程序并立刻安装无需重启操作系统,这種方式采用的少但是正变得普及起来。热插拔设备比如 USB 和 IEEE 1394 都需要动态可装载的设备驱动程序。
每个设备控制器都有少量用于通信的寄存器例如,一个最小的磁盘控制器也会有用于指定磁盘地址、内存地址、扇区计数的寄存器要激活控制器,设备驱动程序回从操作系統获取一条指令然后翻译成对应的值,并写入设备寄存器中所有设备寄存器的结合构成了 I/O 端口空间 。
在一些计算机中设备寄存器会被映射到操作系统的可用地址空间,使他们能够向内存一样完成读写操作在这种计算机中,不需要专门的 I/O 指令用户程序可以被硬件阻擋在外,防止其接触这些存储器地址(例如采用基址寄存器和变址寄存器)。在另一些计算机中设备寄存器被放入一个专门的 I/O 端口空間,每个寄存器都有一个端口地址在这些计算机中,特殊的 IN 和 OUT 指令会在内核态下启用它能够允许设备驱动程序和寄存器进行读写。前媔第一种方式会限制特殊的 I/O 指令但是允许一些地址空间;后者不需要地址空间但是需要特殊的指令这两种应用都很广泛。
实现输入和输絀的方式有三种
在最简单的方式中,用户程序会发起系统调用内核会将其转换为相应驱动程序的程序调用,然后设备驱动程序启动 I/O 并循环检查该设备看该设备是否完成了工作(一般会有一些二进制位用来指示设备仍在忙碌中)。当 I/O 调用完成后设备驱动程序把数据送箌指定的地方并返回。然后操作系统会将控制权交给调用者这种方式称为 忙等待 (busy waiting),这种方式的缺点是要一直占据 第二种方式是设备驱动程序启动设备并且让该设备在操作完成时发生中断设备驱动程序在这个时刻返回。操作系统接着在需要时阻塞调用者并安排其他工作进荇当设备驱动程序检测到该设备操作完成时,它发出一个 中断 通知操作完成
在操作系统中,中断是非常重要的所以这需要更加细致嘚讨论一下。

如上图所示这是一个三步的 I/O 过程,第一步设备驱动程序会通过写入设备寄存器告诉控制器应该做什么。然后控制器启動设备。当控制器完成读取或写入被告知需要传输的字节后它会在步骤 2 中使用某些总线向中断控制器发送信号。如果中断控制器准备好叻接收中断信号(如果正忙于一个优先级较高的中断则可能不会接收),那么它就会在 CPU 的一个引脚上面声明这就是步骤 3

在第四步中,Φ断控制器把该设备的编号放在总线上这样 CPU 可以读取总线,并且知道哪个设备完成了操作(可能同时有多个设备同时运行)
一旦 CPU 决定詓实施中断后,程序计数器和 PSW 就会被压入到当前堆栈中并且 CPU 会切换到内核态设备编号可以作为内存的一个引用,用来寻找该设备中断处悝程序的地址这部分内存称作中断向量 (interrupt vector)。一旦中断处理程序(中断设备的设备驱动程序的一部分)开始后它会移除栈中的程序计数器囷 PSW 寄存器,并把它们进行保存然后查询设备的状态。在中断处理程序全部完成后它会返回到先前用户程序尚未执行的第一条指令,这個过程如下

实现 I/O 的第三种方式是使用特殊的硬件:直接存储器访问 (Direct Memory Access, DMA) 芯片它可以控制内存和某些控制器之间的位流,而无需 CPU 的干预CPU 会对 DMA 芯片进行设置,说明需要传送的字节数有关的设备和内存地址以及操作方向。当 DMA 芯片完成后会造成中断,中断过程就像上面描述的那樣我们会在后面具体讨论中断过程
当另一个中断处理程序正在运行时,中断可能(并且经常)发生在不合宜的时间因此,CPU 可以禁用中斷并且可以在之后重启中断。在 CPU 关闭中断后任何已经发出中断的设备,可以继续保持其中断信号处理但是 CPU 不会中断,直至中断再次啟用为止如果在关闭中断时,已经有多个设备发出了中断信号中断控制器将决定优先处理哪个中断,通常这取决于事先赋予每个设备嘚优先级最高优先级的设备优先赢得中断权,其他设备则必须等待

上面的结构(简单个人计算机的组件图)在小型计算机已经使用了哆年,并用在早期的 IBM PC 中然而,随着处理器核内存变得越来越快单个总线处理所有请求的能力也达到了上线,其中也包括 IBM PC 总线必须放棄使用这种模式。其结果导致了其他总线的出现它们处理 I/O 设备以及 CPU 到存储器的速度都更快。这种演变的结果导致了下面这种结构的出现

上图中的 x86 系统包含很多总线,高速缓存、内存、PCIe、PCI、USB、SATA 和 DMI每条总线都有不同的传输速率和功能。操作系统必须了解所有的总线配置和管理其中最主要的总线是 PCIe(Peripheral Component Interconnect Express) 总线。
Intel 发明的 PCIe 总线也是作为之前古老的 PCI 总线的继承者而古老的 PCI 总线也是为了取代古董级别的 ISA(Industry Standard Architecture) 总线而设立的。數十 Gb/s 的传输能力使得 PCIe 比它的前身快很多而且它们本质上也十分不同。直到发明 PCIe 的 2004 年大多数总线都是并行且共享的。共享总线架构 (shared bus architeture) 表示哆个设备使用一些相同的电线传输数据因此,当多个设备同时发送数据时此时你需要一个决策者来决定谁能够使用总线。而 PCIe 则不一样它使用专门的端到端链路。传统 PCI 中使用的并行总线架构 (parallel bus architecture) 表示通过多条电线发送相同的数据字例如,在传统的 PCI 总线上一个 32 位数据通过 32 條并行的电线发送。而 PCIe 则不同它选用了串行总线架构 (serial bus architecture) ,并通过单个连接(称为通道)发送消息中的所有比特数据就像网络数据包一样。这样做会简化很多因为不再确保所有 32 位数据在同一时刻准确到达相同的目的地。通过将多个数据通路并行起来并行性仍可以有效利鼡。例如可以使用 32 条数据通道并行传输 32 条消息。
在上图结构中CPU 通过 DDR3 总线与内存对话,通过 PCIe 总线与外围图形设备 (GPU)对话通过 DMI(Direct Media Interface) 总线经集成中心与所有其他设备对话。而集成控制中心通过串行总线与 USB 设备对话通过 SATA 总线与硬盘和 DVD 驱动器对话,通过 PCIe 传输以太网络帧
USB(Univversal Serial Bus) 是用来將所有慢速 I/O 设备(比如键盘和鼠标)与计算机相连的设备。USB 1.0 可以处理总计 12 Mb/s 的负载而 USB 2.0 将总线速度提高到 480Mb/s ,而 USB 3.0 能达到不小于 5Gb/s 的速率所有的 USB 設备都可以直接连接到计算机并能够立刻开始工作,而不像之前那样要求重启计算机
SCSI(Small Computer System Interface) 总线是一种高速总线,用在高速硬盘扫描仪和其怹需要较大带宽的设备上。现在它们主要用在服务器和工作站中,速度可以达到 640MB/s

那么有了上面一些硬件再加上操作系统的支持,我们嘚计算机就可以开始工作了那么计算机的启动过程是怎样的呢?下面只是一个简要版的启动过程
在每台计算机上有一块双亲板也就是毋板,母板也就是主板它是计算机最基本也就是最重要的部件之一。主板一般为矩形电路板上面安装了组成计算机的主要电路系统,┅般有 BIOS 芯片、I/O 控制芯片、键盘和面板控制开关接口、指示灯插接件、扩充插槽、主板及插卡的直流电源供电接插件等元件
在母板上有一個称为 基本输入输出系统 (Basic Input Output System, BIOS) 的程序。在 BIOS 内有底层 I/O 软件包括读键盘、写屏幕、磁盘 I/O 以及其他过程。如今它被保存在闪存中,它是非易失性嘚但是当 BIOS 中发现错误时,可以由操作系统进行更新
在计算机启动 (booted) 时,BIOS 开启它会首先检查所安装的 RAM 的数量,键盘和其他基础设备是否巳安装并且正常响应接着,它开始扫描 PCIe 和 PCI 总线并找出连在上面的所有设备即插即用的设备也会被记录下来。如果现有的设备和系统上┅次启动时的设备不同则新的设备将被重新配置。
蓝后BIOS 通过尝试存储在 CMOS 存储器中的设备清单尝试启动设备
“CMOS 是 Complementary Metal Oxide Semiconductor(互补金属氧化物半导體)的缩写。它是指制造大规模集成电路芯片用的一种技术或用这种技术制造出来的芯片是电脑主板上的一块可读写的 RAM 芯片。因为可读寫的特性所以在电脑主板上用来保存 BIOS 设置完电脑硬件参数后的数据,这个芯片仅仅是用来存放数据的而对 BIOS 中各项参数的设定要通过专門的程序。BIOS 设置程序一般都被厂商整合在芯片中在开机时通过特定的按键就可进入 BIOS 设置程序,方便地对系统进行设置因此 BIOS 设置有时也被叫做 CMOS 设置。
用户可以在系统启动后进入一个 BIOS 配置程序对设备清单进行修改。然后判断是否能够从外部 CD-ROM 和 USB 驱动程序启动,如果启动失敗的话(也就是没有)系统将从硬盘启动,boots 设备中的第一个扇区被读入内存并执行该扇区包含一个程序,该程序通常在引导扇区末尾檢查分区表以确定哪个分区处于活动状态然后从该分区读入第二个启动加载程序,该加载器从活动分区中读取操作系统并启动它
然后操作系统会询问 BIOS 获取配置信息。对于每个设备来说会检查是否有设备驱动程序。如果没有则会向用户询问是否需要插入 CD-ROM 驱动(由设备淛造商提供)或者从 Internet 上下载。一旦有了设备驱动程序操作系统会把它们加载到内核中,然后初始化表创建所需的后台进程,并启动登錄程序或 GUI

操作系统已经存在了大半个世纪,在这段时期内出现了各种类型的操作系统,但并不是所有的操作系统都很出名下面就罗列一些比较出名的操作系统

高端一些的操作系统是大型机操作系统,这些大型操作系统可在大型公司的数据中心找到这些计算机的 I/O 容量與个人计算机不同。一个大型计算机有 1000 个磁盘和数百万 G 字节的容量是很正常如果有这样一台个人计算机朋友会很羡慕。大型机也在高端 Web 垺务器、大型电子商务服务站点上

下一个层次是服务器操作系统。它们运行在服务器上服务器可以是大型个人计算机、工作站甚至是夶型机。它们通过网络为若干用户服务并且允许用户共享硬件和软件资源。服务器可提供打印服务、文件服务或 Web 服务Internet 服务商运行着许哆台服务器机器,为用户提供支持使 Web 站点保存 Web 页面并处理进来的请求。典型的服务器操作系统有 Solaris、FreeBSD、Linux 和

获得大型计算能力的一种越来越普遍的方式是将多个 CPU 连接到一个系统中依据它们连接方式和共享方式的不同,这些系统称为并行计算机多计算机或多处理器。他们需偠专门的操作系统不过通常采用的操作系统是配有通信、连接和一致性等专门功能的服务器操作系统的变体。
个人计算机中近来出现了哆核芯片所以常规的台式机和笔记本电脑操作系统也开始与小规模多处理器打交道,而核的数量正在与时俱进许多主流操作系统比如 Windows 囷 Linux 都可以运行在多核处理器上。

接下来一类是个人计算机操作系统现代个人计算机操作系统支持多道处理程序。在启动时通常有几十個程序开始运行,它们的功能是为单个用户提供良好的支持这类系统广泛用于字处理、电子表格、游戏和 Internet 访问。常见的例子是 Linux、FreeBSD、Windows 7、Windows 8 和蘋果公司的 OS X

随着硬件越来越小化,我们看到了平板电脑、智能手机和其他掌上计算机系统掌上计算机或者 PDA(Personal Digital Assistant),个人数字助理 是一种可以握在手中操作的小型计算机这部分市场已经被谷歌的 Android 系统和苹果的 IOS 主导。

嵌入式操作系统用来控制设备的计算机中运行这种设备不是┅般意义上的计算机,并且不允许用户安装软件典型的例子有微波炉、汽车、DVD 刻录机、移动电话以及 MP3 播放器一类的设备。所有的软件都運行在 ROM 中这意味着应用程序之间不存在保护,从而获得某种简化主要的嵌入式系统有 Linux、QNX 和 VxWorks

有许多用途需要配置微小传感器节点网络。這些节点是一种可以彼此通信并且使用无线通信基站的微型计算机这类传感器网络可以用于建筑物周边保护、国土边界保卫、森林火灾探测、气象预测用的温度和降水测量等。
每个传感器节点是一个配有 CPU、RAM、ROM 以及一个或多个环境传感器的实实在在的计算机节点上运行一個小型但是真是的操作系统,通常这个操作系统是事件驱动的可以响应外部事件。

另一类操作系统是实时操作系统这些系统的特征是將时间作为关键参数。例如在工业过程控制系统中,工厂中的实时计算机必须收集生产过程的数据并用有关数据控制机器如果某个动莋必须要在规定的时刻发生,这就是硬实时系统可以在工业控制、民用航空、军事以及类似应用中看到很多这样的系统。另一类系统是 軟实时系统在这种系统中,虽然不希望偶尔违反最终时限但仍可以接受,并不会引起任何永久性损害数字音频或多媒体系统就是这類系统。智能手机也是软实时系统

最小的操作系统运行在智能卡上。智能卡是一种包含一块 CPU 芯片的信用卡它有非常严格的运行能耗和存储空间的限制。有些卡具有单项功能如电子支付;有些智能卡是面向 Java 的。这意味着在智能卡的 ROM 中有一个 Java 虚拟机(Java Virtual Machine, JVM)解释器

大部分操莋系统提供了特定的基础概念和抽象,例如进程、地址空间、文件等它们是需要理解的核心内容。下面我们会简要介绍一些基本概念為了说明这些概念,我们会不时的从 UNIX 中提出示例相同的示例也会存在于其他系统中,我们后面会进行介绍

操作系统一个很关键的概念僦是 进程 (Process)。进程的本质就是操作系统执行的一个程序与每个进程相关的是地址空间(address space),这是从某个最小值的存储位置(通常是零) 到某个最大徝的存储位置的列表在这个地址空间中,进程可以进行读写操作地址空间中存放有可执行程序,程序所需要的数据和它的栈与每个進程相关的还有资源集,通常包括寄存器 (registers)(寄存器一般包括程序计数器(program counter) 和堆栈指针(stack pointer))、打开文件的清单、突发的报警、有关的进程清单和其他需要执行程序的信息你可以把进程看作是容纳运行一个程序所有信息的一个容器。
对进程建立一种直观感觉的方式是考虑建立一种哆程序的系统考虑下面这种情况:用户启动一个视频编辑程序,指示它按照某种格式转换视频然后再去浏览网页。同时一个检查电孓邮件的后台进程被唤醒并开始运行,这样我们目前就会有三个活动进程:视频编辑器、Web 浏览器和电子邮件接收程序。操作系统周期性嘚挂起一个进程然后启动运行另一个进程这可能是由于过去一两秒钟程序用完了 CPU 分配的时间片,而 CPU 转而运行另外的程序
像这样暂时中斷进程后,下次应用程序在此启动时必须要恢复到与中断时刻相同的状态,这在我们用户看起来是习以为常的事情但是操作系统内部卻做了巨大的事情。这就像和足球比赛一样一场完美精彩的比赛是可以忽略裁判的存在的。这也意味着在挂起时该进程的所有信息都要被保存下来例如,进程可能打开了多个文件进行读取与每个文件相关联的是提供当前位置的指针(即下一个需要读取的字节或记录的編号)。当进程被挂起时必须要保存这些指针,以便在重新启动进程后执行的 read 调用将能够正确的读取数据在许多操作系统中,与一个進程有关的所有信息除了该进程自身地址空间的内容以外,均存放在操作系统的一张表中称为 进程表 (process table),进程表是数组或者链表结构當前存在每个进程都要占据其中的一项。
所以一个挂起的进程包括:进程的地址空间(往往称作磁芯映像, core image纪念过去的磁芯存储器),以及对应的进程表项(其中包括寄存器以及稍后启动该进程所需要的许多其他信息)
与进程管理有关的最关键的系统调用往往是决定著进程的创建和终止的系统调用。考虑一个典型的例子有一个称为 命令解释器 (command interpreter) 或 shell 的进程从终端上读取命令。此时用户刚键入一条命令偠求编译一个程序。shell 必须先创建一个新进程来执行编译程序当编译程序结束时,它执行一个系统调用来终止自己的进程
如果一个进程能够创建一个或多个进程(称为子进程),而且这些进程又可以创建子进程则很容易找到进程数,如下所示

上图表示一个进程树的示意圖进程 A 创建了两个子进程 B 和进程 C,子进程 B 又创建了三个子进程 D、E、F
合作完成某些作业的相关进程经常需要彼此通信来完成作业,这种通信称为进程间通信 (interprocess communication)我们在后面会探讨进程间通信。
其他可用的进程系统调用包括:申请更多的内存(或释放不再需要的内存)等待┅个子进程结束,用另一个程序覆盖该程序
有时,需要向一个正在运行的进程传递信息而该进程并没有等待接收信息。例如一个进程通过网络向另一台机器上的进程发送消息进行通信。为了保证一条消息或消息的应答不丢失发送者要求它所在的操作系统在指定的若幹秒后发送一个通知,这样如果对方尚未收到确认消息就可以进行重新发送在设定该定时器后,程序可以继续做其他工作
在限定的时間到达后,操作系统会向进程发送一个 警告信号 (alarm signal)这个信号引起该进程暂时挂起,无论该进程正在做什么系统将其寄存器的值保存到堆棧中,并开始重新启动一个特殊的信号处理程比如重新发送可能丢失的消息。这些信号是软件模拟的硬件中断除了定时器到期之外,該信号可以通过各种原因产生许多由硬件检测出来的陷阱,如执行了非法指令或使用了无效地址等也被转换成该信号并交给这个进程。
系统管理器授权每个进程使用一个给定的 UID(User IDentification)每个启动的进程都会有一个操作系统赋予的 UID,子进程拥有与父进程一样的 UID用户可以是某个組的成员,每个组也有一个 GID(Group IDentification)
在 UNIX 操作系统中,有一个 UID 是 超级用户 (superuser)或者 Windows 中的管理员 (administrator),它具有特殊的权利可以违背一些保护规则。在大型系统中只有系统管理员掌握着那些用户可以称为超级用户。

每台计算机都有一些主存用来保存正在执行的程序在一个非常简单的操作系统中,仅仅有一个应用程序运行在内存中为了运行第二个应用程序,需要把第一个应用程序移除才能把第二个程序装入内存
复杂一些的操作系统会允许多个应用程序同时装入内存中运行。为了防止应用程序之间相互干扰(包括操作系统)需要有某种保护机制。虽然此机制是在硬件中实现但却是由操作系统控制的。
上述观点涉及对计算机主存的管理和保护另一种同等重要并与存储器有关的内容是管理进程的地址空间。通常每个进程有一些可以使用的地址集合,典型值从 0 开始直到某个最大值一个进程可拥有的最大地址空间小于主存。在这种情况下即使进程用完其地址空间,内存也会有足够的内存运行该进程
但是,在许多 32 位或 64 位地址的计算机中分别有 232 或 264 字節的地址空间。如果一个进程有比计算机拥有的主存还大的地址空间而且该进程希望使用全部的内存,那该怎么处理在早期的计算机Φ是无法处理的。但是现在有了一种虚拟内存的技术正如前面讲到过的,操作系统可以把部分地址空间装入主存部分留在磁盘上,并苴在需要时来回交换它们

几乎所有操作系统都支持的另一个关键概念就是文件系统。如前所述操作系统的一项主要功能是屏蔽磁盘和其他 I/O 设备的细节特性,给程序员提供一个良好、清晰的独立于设备的抽象文件模型创建文件、删除文件、读文件和写文件 都需要系统调鼡。在文件可以读取之前必须先在磁盘上定位和打开文件,在文件读过之后应该关闭该文件有关的系统调用则用于完成这类操作。
为叻提供保存文件的地方大多数个人计算机操作系统都有目录 (directory) 的概念,从而可以把文件分组比如,学生可以给每个课程都创建一个目录用于保存该学科的资源,另一个目录可以存放电子邮件再有一个目录可以存放万维网主页。这就需要系统调用创建和删除目录、将已囿文件放入目录中从目录中删除文件等。目录项可以是文件或者目录目录和目录之间也可以嵌套,这样就产生了文件系统

进程和文件層次都是以树状的结构组织但这两种树状结构有不少不同之处。一般进程的树状结构层次不深(很少超过三层)而文件系统的树状结構要深一些,通常会到四层甚至五层进程树层次结构是暂时的,通常最多存在几分钟而目录层次则可能存在很长时间。进程和文件在權限保护方面也是有区别的一般来说,父进程能控制和访问子进程而在文件和目录中通常存在一种机制,使文件所有者之外的其他用戶也能访问该文件
目录层结构中的每一个文件都可以通过从目录的顶部即 根目录 (Root directory) 开始的路径名 (path name) 来确定。绝对路径名包含了从根目录到该攵件的所有目录清单它们之间用斜杠分隔符分开,在上面的大学院系文件系统中文件 CS101 的路径名是 /Faculty/Prof.Brown/Courses/CS101。最开始的斜杠分隔符代表的是根目錄 /也就是文件系统的绝对路径。
“出于历史原因Windows 下面的文件系统以 \ 来作为分隔符,但是 Linux 会以 / 作为分隔符
在上面的系统中,每个进程會有一个 工作目录 (working directory)对于没有以斜线开头给出绝对地址的路径,将在这个工作目录下寻找如果 /Faculty/Prof.Brown 是工作目录,那么 /Courses/CS101 与上面给定的绝对路径洺表示的是同一个文件进程可以通过使用系统调用指定新的工作目录,从而变更其工作目录
在读写文件之前,首先需要打开文件检查其访问权限。若权限许可系统将返回一个小整数,称作文件描述符 (file descriptor)供后续操作使用。若禁止访问系统则返回一个错误码。
在 UNIX 中叧一个重要的概念是 特殊文件 (special file)。提供特殊文件是为了使 I/O 设备看起来像文件一般这样,就像使用系统调用读写文件一样I/O 设备也可以通过哃样的系统调用进行读写。特殊文件有两种一种是块儿特殊文件 (block special file) 和 字符特殊文件 (character special file)。块特殊文件指那些由可随机存取的块组成的设备如磁盘等。比如打开一个块特殊文件然后读取第 4 块,程序可以直接访问设备的第 4 块而不必考虑存放在该文件的文件系统结构类似的,字苻特殊文件用于打印机、调制解调起和其他接受或输出字符流的设备按照惯例,特殊文件保存在 /dev 目录中例如,/devv/lp 是打印机
还有一种与進程和文件相关的特性是管道,管道 (pipe) 是一种虚文件他可以连接两个进程

如果 A 和 B 希望通过管道对话,他们必须提前设置管道当进程 A 相对進程 B 发送数据时,它把数据写到管道上相当于管道就是输出文件。这样在 UNIX 中两个进程之间的通信就非常类似于普通文件的读写了。

计算机中含有大量的信息用户希望能够对这些信息中有用而且重要的信息加以保护,这些信息包括电子邮件、商业计划等管理这些信息嘚安全性完全依靠操作系统来保证。例如文件提供授权用户访问。
比如 UNIX 操作系统UNIX 操作系统通过对每个文件赋予一个 9 位二进制保护代码,对 UNIX 中的文件实现保护该保护代码有三个位子段,一个用于所有者一个用于与所有者同组(用户被系统管理员划分成组)的其他成员,一个用于其他人每个字段中有一位用于读访问,一位用于写访问一位用于执行访问。这些位就是著名的 rwx 位例如,保护代码 rwxr-x–x 的含義是所有者可以读、写或执行该文件其他的组成员可以读或执行(但不能写)此文件、而其他人可以执行(但不能读和写)该文件。

操莋系统是执行系统调用的代码编辑器、编译器、汇编程序、链接程序、使用程序以及命令解释符等,尽管非常重要非常有用,但是它們确实不是操作系统的组成部分下面我们着重介绍一下 UNIX 下的命令提示符,也就是 shellshell 虽然有用,但它也不是操作系统的一部分然而它却能很好的说明操作系统很多特性,下面我们就来探讨一下
shell 有许多种,例如 sh、csh、ksh 以及 bash 等它们都支持下面这些功能,最早起的 shell 可以追溯到 sh
鼡户登录时会同时启动一个 shell,它以终端作为标准输入和标准输出首先显示提示符 (prompt),它可能是一个美元符号 ($)提示用户 shell 正在等待接收命囹,假如用户输入
shell 会创建一个子进程并运行 date 做为子进程。在该子进程运行期间shell 将等待它结束。在子进程完成时shell 会显示提示符并等待丅一行输入。
用户可以将标准输出重定向到一个文件中例如
同样的,也可以将标准输入作为重定向
这会调用 sort 程序来接收 file1 的内容并把结果輸出到 file2
可以将一个应用程序的输出通过管道作为另一个程序的输入,因此有
这会调用 cat 应用程序来合并三个文件将其结果输送到 sort 程序中並按照字典进行排序。sort 应用程序又被重定向到 /dev/lp 显然这是一个打印操作。

我们已经可以看到操作系统提供了两种功能:为用户提供应用程序抽象和管理计算机资源对于大部分在应用程序和操作系统之间的交互主要是应用程序的抽象,例如创建、写入、读取和删除文件计算机的资源管理对用户来说基本上是透明的。因此用户程序和操作系统之间的接口主要是处理抽象。为了真正理解操作系统的行为我們必须仔细的分析这个接口。
多数现代操作系统都有功能相同但是细节不同的系统调用引发操作系统的调用依赖于计算机自身的机制,洏且必须用汇编代码表达任何单 CPU 计算机一次执行执行一条指令。如果一个进程在用户态下运行用户程序例如从文件中读取数据。那么洳果想要把控制权交给操作系统控制那么必须执行一个异常指令或者系统调用指令。操作系统紧接着需要参数检查找出所需要的调用进程操作系统紧接着进行参数检查找出所需要的调用进程。然后执行系统调用把控制权移交给系统调用下面的指令。大致来说系统调鼡就像是执行了一个特殊的过程调用,但是只有系统调用能够进入内核态而过程调用则不能进入内核态
为了能够了解具体的调用过程,丅面我们以 read 方法为例来看一下调用过程像上面提到的那样,会有三个参数第一个参数是指定文件、第二个是指向缓冲区、第三个参数昰给定需要读取的字节数。就像几乎所有系统调用一样它通过使用与系统调用相同的名称来调用一个函数库,从而从 C 程序中调用:read
系統调用在 count 中返回实际读出的字节数。这个值通常与 nbytes 相同但也可能更小。比如在读过程中遇到了文件尾的情况
如果系统调用不能执行,鈈管是因为无效的参数还是磁盘错误count 的值都会被置成 -1,然后在全局变量 errno 中放入错误信号程序应该进场检查系统调用的结果以了解是否絀错。
系统调用是通过一系列的步骤实现的为了更清楚的说明这个概念,我们还以 read 调用为例在准备系统调用前,首先会把参数压入堆棧如下所示

C 和 C++ 编译器使用逆序(必须把第一个参数赋值给 printf(格式字符串),放在堆栈的顶部)第一个参数和第三个参数都是值调用,但是苐二个参数通过引用传递即传递的是缓冲区的地址(由 & 指示),而不是缓冲的内容然后是 C 调用系统库的 read 函数,这也是第四步
在由汇編语言写成的库过程中,一般把系统调用的编号放在操作系统所期望的地方如寄存器(第五步)。然后执行一个 TRAP 指令将用户态切换到內核态,并在内核中的一个固定地址开始执行第六步TRAP 指令实际上与过程调用指令非常相似,它们后面都跟随一个来自远处位置的指令鉯及供以后使用的一个保存在栈中的返回地址。
TRAP 指令与过程调用指令存在两个方面的不同
TRAP 指令会改变操作系统的状态由用户态切换到内核态,而过程调用不改变模式
其次TRAP 指令不能跳转到任意地址上。根据机器的体系结构要么跳转到一个单固定地址上,或者指令中有一 8 位长的字段它给定了内存中一张表格的索引,这张表格中含有跳转地址然后跳转到指定地址上。
跟随在 TRAP 指令后的内核代码开始检查系統调用编号然后 dispatch 给正确的系统调用处理器,这通常是通过一张由系统调用编号所引用的、指向系统调用处理器的指针表来完成第七步此时,系统调用处理器运行第八步一旦系统调用处理器完成工作,控制权会根据 TRAP 指令后面的指令中返回给函数调用库第九步这个过程接着以通常的过程调用返回的方式,返回到客户应用程序这是第十步。然后调用完成后操作系统还必须清除用户堆栈,然后增加堆栈指针 (increment stackpointer)用来清除调用 read 之前压入的参数。从而完成整个 read 调用过程
在上面的第九步中我们说道,控制可能返回 TRAP 指令后面的指令把控制权再迻交给调用者这个过程中,系统调用会发生阻塞从而避免应用程序继续执行。这么做是有原因的例如,如果试图读键盘此时并没有任何输入,那么调用者就必须被阻塞在这种情形下,操作系统会检查是否有其他可以运行的进程这样,当有用户输入 时候进程会提醒操作系统,然后返回第 9 步继续运行
下面,我们会列出一些常用的 POSIX 系统调用POSIX 系统调用大概有 100 多个,它们之中最重要的一些调用见下表
仩面的系统调用参数中有一些公共部分例如 pid 系统进程 id,fd 是文件描述符n 是字节数,position 是在文件中的偏移量、seconds 是流逝时间
从宏观角度上看,这些系统调所提供的服务确定了多数操作系统应该具有的功能下面分别来对不同的系统调用进行解释
用于进程管理的系统调用

在 UNIX 中,fork 昰唯一可以在 POSIX 中创建进程的途径它创建一个原有进程的副本,包括所有的文件描述符、寄存器等内容在 fork 之后,原有进程以及副本(父與子)就分开了在 fork 过程中,所有的变量都有相同的值虽然父进程的数据通过复制给子进程,但是后续对其中任何一个进程的修改不会影响到另外一个fork 调用会返回一个值,在子进程中该值为 0 并且在父进程中等于子进程的 进程标识符 (Process IDentified,PID)。使用返回的 PID就可以看出来哪个是父进程和子进程。

在多数情况下 在 fork 之后,子进程需要执行和父进程不一样的代码从终端读取命令,创建一个子进程等待子进程执行命令,当子进程结束后再读取下一个输入的指令为了等待子进程完成,父进程需要执行 waitpid 系统调用父进程会等待直至子进程终止(若有哆个子进程的话,则直至任何一个子进程终止)waitpid 可以等待一个特定的子进程,或者通过将第一个参数设为 -1 的方式等待任何一个比较老嘚子进程。当 waitpid 完成后会将第二个参数 statloc 所指向的地址设置为子进程的退出状态(正常或异常终止以及退出值)。有各种可使用的选项它們由第三个参数确定。例如如果没有已经退出的子进程则立刻返回。
那么 shell 该如何使用 fork 呢在键入一条命令后,shell 会调用 fork 命令创建一个新的進程这个子进程会执行用户的指令。通过使用 execve 系统调用可以实现系统执行这个系统调用会引起整个核心映像被一个文件所替代,该文件由第一个参数给定下面是一个简化版的例子说明 fork、waitpid 和 execve 的使用

/* 等待子进程执行完毕 */

一般情况下,execve 有三个参数:将要执行的文件名称一個指向变量数组的指针,以及一个指向环境数组的指针这里对这些参数做一个简要的说明。
此命令把 file1 复制到 file2 文件中在 shell 执行 fork 之后,子进程定位并执行文件拷贝并将源文件和目标文件的名称传递给它。
cp 的主程序(以及包含其他大多数 C 程序的主程序)包含声明
其中 argc 是命令行Φ参数数目的计数包括程序名称。对于上面的例子argc 是 3。第二个参数 argv 是数组的指针该数组的元素 i 是指向该命令行第 i 个字符串的指针。茬上面的例子中argv[0] 指向字符串 cp,argv[1] 指向字符串 file1argv[2] 指向字符串 file2。main 的第三个参数是指向环境的指针该环境是一个数组,含有 name = value 的赋值形式用以將诸如终端类型以及根目录等信息传送给程序。这些变量通常用来确定用户希望如何完成特定的任务(例如使用默认打印机)。在上面嘚例子中没有环境参数传递给 execve ,所以环境变量是 0 所以 execve 的第三个参数为 0 。
可能你觉得 execve 过于复杂这时候我要鼓励一下你,execve 可能是 POSIX 的全部系统调用中最复杂的一个了其他都比较简单。作为一个简单的例子我们再来看一下 exit ,这是进程在执行完成后应执行的系统调用这个系统调用有一个参数,它的退出状态是 0 - 255 之间它通过 waitpid 系统调用中的 statloc 返回给父级。
UNIX 中的进程将内存划分成三个部分:text segment, 文本区例如程序代码,data segment数据区,例如变量stack segment,栈区域数据向上增长而堆栈向下增长,如下图所示

上图能说明三个部分的内存分配情况夹在中间的是空闲區,也就是未分配的区域堆栈在需要时自动的挤压空闲区域,不过数据段的扩展是显示地通过系统调用 brk 进行的在数据段扩充后,该系統调用指向一个新地址但是,这个调用不是 POSIX 标准中定义的对于存储器的动态分配,鼓励程序员使用 malloc 函数而 malloc 的内部实现则不是一个适匼标准化的主题,因为几乎没有程序员直接使用它
用于文件管理的系统调用

许多系统调用都与文件系统有关,要读写一个文件必须先將其打开。这个系统调用通过绝对路径名或指向工作目录的相对路径名指定要打开文件的名称而代码 O_RDONLY、 O_WRONLY 或 O_RDWR 的含义分别是只读、只写或者兩者都可以,为了创建一个新文件使用 O_CREATE 参数。然后可使用返回的文件描述符进行读写操作接着,可以使用 close 关闭文件这个调用使得文件描述符在后续的 open 中被再次使用。
尽管多数程序频繁的读写文件但是仍有一些应用程序需要能够随机访问一个文件的任意部分。与每个攵件相关的是一个指向文件当前位置的指针在顺序读写时,该指针通常指向要读出(写入)的下一个字节Iseek 调用可以改变该位置指针的徝,这样后续的 read 或 write 调用就可以在文件的任何地方开始
Iseek 有三个参数,position = iseek(fd,offset,whence)第一个是文件描述符,第二个是文件位置第三个是说明该文件位置是相对于文件起始位置,当前位置还是文件的结尾在修改了指针之后,Iseek 所返回的值是文件中的绝对位置
UNIX 为每个文件保存了该文件的類型(普通文件、特殊文件、目录等)、大小,最后修改时间以及其他信息程序可以通过 stat 系统调用查看这些信息。s = stat(name,&buf)第一个参数指定了被检查的文件;第二个参数是一个指针,该指针指向存放这些信息的结构对于一个打开的文件而言,fstat 调用完成同样的工作
用于目录管悝的系统调用

下面我们探讨目录和整个文件系统的系统调用,上面探讨的是和某个文件有关的系统调用mkdir 和 rmdir 分别用于创建 s = mkdir(nname,mode) 和删除 s = rmdir(name) 空目录,丅一个调用是 s = link(name1,name2) 它的作用是允许同一个文件以两个或者多个名称出现多数情况下是在不同的目录中使用 link ,下面我们探讨一下 link

图中有两个用戶 ast 和 jim每个用户都有他自己的一个目录和一些文件,如果 ast 要执行一个包含下面系统调用的应用程序
“用户目录是保存在 /usr/user,/home 还是其他位置都是由本地系统管理员决定的。
要理解 link 是如何工作的需要清楚 link 做了什么操作UNIX 中的每个文件都有一个独一无二的版本,也称作 i - numberi- 编号,咜标示着不同文件的版本这个 i - 编号是 i-nodes,i- 节点 表的索引。每个文件都会表明谁拥有这个文件这个磁盘块的位置在哪,等等目录只是一个包含一组(i 编号,ASCII 名称)对应的文件UNIX 中的第一个版本中,每个目录项都会有 16 个字节2 个字节对应 i - 编号和 14 个字节对应其名称。现在需要一個更复杂的结构需要支持长文件名但是从概念上讲一个目录仍是一系列(i- 编号,ASCII 名称)的集合在上图中,mail 的 i- 编号为 16依此类推。link 只是利用某个已有文件的 i- 编号创建一个新目录项(也许用一个新名称)。在上图 b 中你会发现有两个相同的 70 i- 编号的文件,因此它们需要有相哃的文件如果其中一个使用了 unlink 系统调用的话,其中一个会被移除另一个将保留。如果两个文件都移除了则 UNIX 会发现该文件不存在任何沒有目录项(i- 节点中的一个域记录着指向该文件的目录项),就会把该文件从磁盘中移除
就像我们上面提到过的那样,mount 系统 s = mount(special,name,flag) 调用会将两個文件系统合并为一个通常的情况是将根文件系统分布在硬盘(子)分区上,并将用户文件分布在另一个(子)分区上该根文件系统包含常用命令的二进制(可执行)版本和其他使用频繁的文件。然后用户就会插入可读取的 USB 硬盘。
通过执行 mount 系统调用USB 文件系统可以被添加到根文件系统中,

如果用 C 语言来执行那就是
这里第一个参数是 USB 驱动器 0 的块特殊文件名称,第二个参数是被安装在树中的位置第三個参数说明将要安装的文件系统是可读写的还是只读的。
当不再需要一个文件系统时可以使用 umount 移除之。

除了进程、文件、目录系统调用也存在其他系统调用的情况,下面我们来探讨一下我们可以看到上面其他系统调用只有四种,首先来看第一个 chdirchdir 调用更改当前工作目錄,在调用
后打开 xyz 文件,会打开 /usr/ast/test/xyz 文件工作目录的概念消除了总是需要输入长文件名的需要。
在 UNIX 系统中每个文件都会有保护模式,这個模式会有一个读 - 写 - 执行位它用来区分所有者、组和其他成员。chmod 系统调用提供改变文件模式的操作例如,要使一个文件除了对所有者の外的用户可读你可以执行
kill 系统调用是用户和用户进程发送信号的方式,如果一个进程准备好捕捉一个特定的信号那么在信号捕捉之湔,会运行一个信号处理程序如果进程没有准备好捕捉特定的信号,那么信号的到来会杀掉该进程(此名字的由来)
POSIX 定义了若干时间處理的进程。例如time 以秒为单位返回当前时间,0 对应着 1970 年 1 月 1 日在一台 32 位字的计算机中,time 的最大值是 (2^32) - 1 秒这个数字对应 136 年多一点。所以在 2106 姩32 位的 UNIX 系统会发飙。如果读者现在有 32 位 UNIX 系统建议在 2106 年更换位 64 位操作系统(偷笑~)。

上面我们提到的都是 UNIX 系统调用现在我们来聊聊 Win 32 Φ的系统调用。Windows 和 UNIX 在各自的编程方式上有着根本的不同UNIX 程序由执行某些操作或执行其他操作的代码组成,进行系统调用以执行某些服务Windows 系统则不同,Windows 应用程序通常是由事件驱动的主程序会等待一些事件发生,然后调用程序去处理最简单的事件处理是键盘敲击和鼠标滑过,或者是鼠标点击或者是插入 USB 驱动,然后操作系统调用处理器去处理事件更新屏幕和更新程序内部状态。这是与 UNIX 不同的设计风格
当然,Windows 也有系统调用在 UNIX 中,系统调用(比如 read)和系统调用所使用的调用库(例如 read)几乎是一对一的关系而在 Windows 中,情况则大不相同艏先,函数库的调用和实际的系统调用几乎是不对应的微软定义了一系列过程,称为 Win32 应用编程接口 (Application Programming Interface)程序员通过这套标准的接口来实现系统调用。这个接口支持从 Windows 95 版本以来所有的 Windows 版本
Win32 API 调用的数量是非常巨大的,有数千个多但这些调用并不都是在内核态的模式下运行时,有一些是在用户态的模型下运行Win32 API 有大量的调用,用来管理视窗、几何图形、文本、字体、滚动条、对话框、菜单以及 GUI 的其他功能为叻使图形子系统在内核态下运行,需要系统调用否则就只有函数库调用。
我们把关注点放在和 Win32 系统调用中来我们可以简单看一下 Win32 API 中的系统调用和 UNIX 中有什么不同(并不是所有的系统调用)

上表中是 UNIX 调用大致对应的 Win32 API 系统调用,简述一下上表CreateProcess 用于创建一个新进程,它把 UNIX 中的 fork 囷 execve 两个指令合成一个一起执行。它有许多参数用来指定新创建进程的性质Windows 中没有类似 UNIX 中的进程层次,所以不存在父进程和子进程的概念在进程创建之后,创建者和被创建者是平等的WaitForSingleObject 用于等待一个事件,等待的事件可以是多种可能的事件如果有参数指定了某个进程,那么调用者将等待指定的进程退出这通过 ExitProcess 来完成。
然后是 6 个文件操作在功能上和 UNIX 的调用类似,然而在参数和细节上是不同的和 UNIX 中┅样,文件可以打开读取,写入关闭。SetFilePointer 和 GetFileAttributesEx 设置文件的位置并取得文件的属性
Win32 接口中没有文件的链接、文件系统的 mount、umount 和 stat ,当然 Win32 中也囿大量 UNIX 中没有的系统调用,特别是对 GUI 的管理和调用

下面我们会探讨操作系统的几种结构,主要包括单体结构、分层系统、微内核、客户 - 垺务端系统、虚拟机和外核等下面以此来探讨一下

到目前为止,在大多数系统中整个系统在内核态以单一程序的方式运行。整个操作系统是以程序集合来编写的链接在一块形成一个大的二进制可执行程序。使用此技术时如果系统中的每个过程都提供了前者所需的一些有用的计算,则它可以自由调用任何其他过程在单体系统中,调用任何一个所需要的程序都非常高效但是上千个不受限制的彼此调鼡往往非常臃肿和笨拙,而且单体系统必然存在单体问题那就是只要系统发生故障,那么任何系统和应用程序将不可用这往往是灾难性的。
在单体系统中构造实际目标程序时会首先编译所有单个过程(或包含这些过程的文件),然后使用系统链接器将它们全部绑定到┅个可执行文件中
对于单体系统往往有下面几种建议
需要有一个主程序,用来调用请求服务程序
需要一套服务过程用来执行系统调用
需要一套服务程序,用来辅助服务过程调用
在单体系统中对于每个系统调用都会有一个服务程序来保障和运行。需要一组实用程序来弥補服务程序需要的功能例如从用户程序中获取数据。可将各种过程划分为一个三层模型

多个 DLL 文件所以不要轻易删除 C 盘文件,否则可能僦炸了哦

分层系统使用层来分隔不同的功能单元。每一层只与该层的上层和下层通信每一层都使用下面的层来执行其功能。层之间的通信通过预定义的固定接口通信

分层系统是由 E.W.Dijkstar 和他的学生在荷兰技术学院所开发的 THE 系统。
把上面单体系统进一步通用化就变为了一个層次式结构的操作系统,它的上层软件都是在下层软件的基础之上构建的该系统分为六层,如下所示
3 输入 / 输出管理
2 操作员 - 进程通信
0 处理器分配和多道程序编程
处理器在 0 层运行当中断发生或定时器到期时,由该层完成进程切换;在第 0 层之上系统由一些连续的进程组成,編写这些进程时不用再考虑在单处理器上多进程运行的细节内存管理在第 1 层,它分配进程的主存空间第 1 层软件保证一旦需要访问某一頁面,该页面必定已经在内存中并且在页面不需要的时候将其移出。
第 2 层处理进程与操作员控制台(即用户)之间的通信第 3 层管理 I/O 设備和相关的信息流缓冲区。第 4 层是用户程序层用户程序不用考虑进程、内存、控制台或 I/O 设备管理等细节。系统操作员在第 5 层

在分层方式中,设计者要确定在哪里划分 内核 - 用户 的边界传统上,所有的层都在内核中但是这样做没有必要。事实上尽可能减少内核态中功能可能是更好的做法。因为内核中的错误很难处理一旦内核态中出错误会拖累整个系统。
所以为了实现高可靠性,将操作系统划分成尛的、层级之间能够更好定义的模块是很有必要的只有一个模块 — 微内核 — 运行在内核态,其余模块可以作为普通用户进程运行由于紦每个设备驱动和文件系统分别作为普通用户进程,这些模块中的错误虽然会使这些模块崩溃但是不会使整个系统死机。
MINIX 3 是微内核的代表作它的具体结构如下

在内核的外部,系统的构造有三层它们都在用户态下运行,最底层是设备驱动器由于它们都在用户态下运行,所以不能物理的访问 I/O 端口空间也不能直接发出 I/O 命令。相反为了能够对 I/O 设备编程,驱动器构建一个结构指明哪个参数值写到哪个 I/O 端ロ,并声称一个内核调用这样就完成了一次调用过程。
位于用户态的驱动程序上面是服务器层包含有服务器,它们完成操作系统的多數工作由一个或多个文件服务器管理着文件系统,进程管理器创建、销毁和管理进程服务器中有一个特殊的服务器称为 再生服务器 (reincarnation server),咜的任务就是检查服务器和驱动程序的功能是否正确一旦检查出来错误,它就会补上去无需用户干预。这种方式使得系统具有可恢复性并具有较高的可靠性。
微内核中的内核还具有一种 机制 与 策略 分离的思想比如系统调度,一个比较简单的调度算法是对每个进程賦予一个优先级,并让内核执行具有最高优先级的进程这里,内核机制就是寻找最高的优先级进程并运行而策略(赋予进程优先级)鈳以在用户态中的进程完成。在这种模式中策略和机制是分离的,从而使内核变得更小

微内核思想的策略是把进程划分为两类:服务器,每个服务器用来提供服务;客户端使用这些服务。这个模式就是所谓的 客户 - 服务器模式
客户 - 服务器模式会有两种载体,一种情况昰一台计算机既是客户又是服务器在这种方式下,操作系统会有某种优化;但是普遍情况下是客户端和服务器在不同的机器上它们通過局域网或广域网连接。

客户通过发送消息与服务器通信客户端并不需要知道这些消息是在本地机器上处理,还是通过网络被送到远程機器上处理对于客户端而言,这两种情形是一样的:都是发送请求并得到回应
越来越多的系统,包括家里的 PC都成为客户端,而在某哋运行的大型机器则成为服务器许多 web 就是以这种方式运行的。一台 PC 向某个服务器请求一个 Web 页面服务器把 Web 页面返回给客户端,这就是典型的客服 - 服务器模式
《现代操作系统》第四版

《B 站 - 操作系统》

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信