Linux操作系统分析
主讲:陈香兰
助教:贾永泉、毛熠璐
xlanchen@ustc.edu.cn
3606864-83(西区电三421)
Autumn 2007
上次课内容回顾
Linux简介
Linux内核分析的一些基础知识
操作系统基本概念
堆栈
用户态/内核态
虚拟内存
xlanchen@2007.9.13 Linux Operating System Analysis 2
基于i386体系结构的
Linux启动代码分析
xlanchen@2007.9.13
主要内容
源代码简介
启动代码简介
Linux内核代码组成分析
Linux的启动层次
Linux的启动分析
xlanchen@2007.9.13 Linux Operating System Analysis 4
源代码来源
根据《Understanding the Linux Kernel》
(2nd Edition),我们采用Linux-2.4.18
有中文版
下载地址:
ftp://ftp.kernel.org/pub/linux/kernel/v2.6/linux-
2.4.18.tar.gz
加压缩后,建立Source Insight工程
xlanchen@2007.9.13 Linux Operating System Analysis 5
Source Insight
可以用来辅助代码阅读
到http://www.sourceinsight.com/上可以下载
到它的试用版,试用期估计在30天左右
xlanchen@2007.9.13 Linux Operating System Analysis 6
Linux-2.6.11
阅读linux目录下的README
关于Linux的介绍
该版本内核支持的体系结构
如何配置、编译、安装
xlanchen@2007.9.13 Linux Operating System Analysis 7
Linux内核源代码中的主要子目录
Documentation 内核方面的相关文档。
arch 与体系结构相关的代码。对应于每个
支持的体系结构,有一个相应的目录
如i386、arm、alpha等。每个体系结
构子目录下包含几个主要的子目录:
kernel 与体系结构相关的核心代码
mm 与体系结构相关的内存管理代码
lib 与体系结构相关的库代码
include 内核头文件。对每种支持的体系结构
有相应的子目录。
init 内核初始化代码。
xlanchen@2007.9.13 Linux Operating System Analysis 8
kernel 内核管理代码。
mm 内存管理代码。
ipc 进程间通讯代码。
net 网络部分代码。
lib 与体系结构无关的内核库代码。
drivers 设备驱动代码。每类设备有相应的子
目录,如char、block、net等
fs 文件系统代码。每个支持文件系统有
相应的子目录,如ext2、proc等。
modules 可动态加载的模块。
Scripts 配置核心的脚本文件。
xlanchen@2007.9.13 Linux Operating System Analysis 9
考虑Arch为i386
在arch/i386下存在如下目录
I386的启动源代码文件目录
I386的核心源代码文件目录
I386的库源代码文件目录
I386的数学仿真源代码文件目录
I386的内存管理源代码文件目录
I386的配置文件
I386的体系相关部分的Makefile
I386的Linux内核的链接描述文件
xlanchen@2007.9.13 Linux Operating System Analysis 10
I386的启动代码文件
在arch/i386/boot目录下
I386的体系结构相关部分的启动代码
都采用汇编码写的
启动扇区中的启动代码,
其目标码必然是512字节
I386初始化
在arch/i386/boot/compressed目录下
内核解压缩
xlanchen@2007.9.13 Linux Operating System Analysis 11
在arch/i386/kernel目录下的.S文件
32位启动代码
在init目录下
这是体系结构无关部分,i386体系结构相关部分的启动,
其目的就是进入main.c中的start_kernel处执行
xlanchen@2007.9.13 Linux Operating System Analysis 12
阅读
documentation/i386/boot.txt
对于i386平台,由于一些历史的原因,因此
Linux的启动比较复杂
这个文档包含如下内容
1、Linux/i386的启动协议(4个)
2、内存布局图
3、实模式下的内核头结构
4、内核的命令行(command line)
xlanchen@2007.9.13 Linux Operating System Analysis 13
5、启动配置示例
6、装载Linux的剩余部分
7、特殊的命令行参数
8、运行内核
9、高级启动回调函数
关于其中的一些内容,我们将在合适的时候说
明
xlanchen@2007.9.13 Linux Operating System Analysis 14
阅读顶层目录下的Makefile
找到缺省目标
链接
xlanchen@2007.9.13 Linux Operating System Analysis 15
找到vmlinux
找到vmlinux所依赖的各个文件或者目标
可以看到vmlinux包含如下内容
i386/kernel/head.S
+ init/main.c + init/version.o
+ CORE_FILES + DRIVERS
+ NETWORKS + LIBS
xlanchen@2007.9.13 Linux Operating System Analysis 16
若make install
在i386的Makefile中有install规则
若make boot/bzImage/zImage等等,则要找
到对应的目标然后进行
make boot在顶层的Makefile中可以找到boot规则
bzImage/zImage可以在i386的Makefile中找到相应
规则
其他的zXXX/bzXXX也都依赖于boot下的
zImage/bzImage
它们最终都找到i386/boot的Makefile
xlanchen@2007.9.13 Linux Operating System Analysis 17
i386/boot的Makefile
看i386/boot的Makefile
z代表压缩;b代表大内核
可见compressed下的vmlinux/bvmlinux为
compressed/head.S + 压缩后的顶层目录下的
vmlinux
zImage为bootsect + setup + compressed/vmlinux
bzImage为
bbootsect + bsetup + compressed/bvmlinux
xlanchen@2007.9.13 Linux Operating System Analysis 18
下面根据在bzImage/zImage中的顺序,我们
依次看启动相关的源代码和相关概念
arch/i386/boot/bootsect.S
arch/i386/boot/setup.S
arch/i386/boot/compressed/head.S
arch/i386/kernel/head.S
最后进入kernel/main.C
xlanchen@2007.9.13 Linux Operating System Analysis 19
I386机器的启动层次
BIOS (Basic I/O System)
Boot loader
软盘启动、硬盘启动
Linux kernel
xlanchen@2007.9.13 Linux Operating System Analysis 20
BIOS
加电,RESET引脚
初始化寄存器;CS:IP = 0xfffffff0, in ROM
ROMBIOS
BIOS启动内容
POST(上电自检)
初始化硬件设备
搜索一个操作系统来启动
根据配置,操作系统可以在软盘/硬盘/CD_ROM上
把对应设备的第一个扇区的内容(boot loader或部分)拷贝
到RAM(0x7c00)处
跳转到0x7c00处执行
xlanchen@2007.9.13 Linux Operating System Analysis 21
Boot loader(引导装载程序)
BIOS调用Boot loader来把操作系统的内核映像装载
到RAM中
考虑IBM PC的启动
软盘启动:BIOS拷贝第一个扇区的内容(bootsect)到
RAM(0x7c00)中
硬盘启动:
硬盘的第一个扇区:主引导记录MBR, Master Boot Record,
MBR存储该硬盘的分区表+一小段引导程序
这个引导程序用来装载OS所在分区的第一个扇区(boot
loader)的内容到RAM中
这个引导程序也可以被替换
xlanchen@2007.9.13 Linux Operating System Analysis 22
Linux的Boot Loader
典型的有:LILO和Grub
LILO(Linux Loader)
可以被安装在OS分区的第一个扇区(启动扇区)
也可以代替MBR中的引导程序
事实上,LILO的代码尺寸大于一个扇区,因此被分成
两个部分
MBR或启动扇区部分
剩余部分
第一部分也被BIOS装载到RAM中0x7c00的位置
第一部分在运行时将自己完整的装载到RAM中
xlanchen@2007.9.13 Linux Operating System Analysis 23
Linux的Boot Loader
通常LILO或GRUB会显示一个已安装操作系统
的列表
按照用户的选择(或者按照缺省项)装载目标
操作系统运行
可能装载操作系统指定的启动代码运行
可能直接装载操作系统内核来运行
xlanchen@2007.9.13 Linux Operating System Analysis 24
LILO的OS启动过程
显示“Loading…”
操作系统前512(一个扇区大小,bootsect)
的内容被装载到RAM的0x90000
紧接着的内容(setup)被装在到0x90200
其他操作系统内核被装载到
对于小内核:0x10000(即64K处),称为低装载
对于大内核:0x100000(即1M处),称为高装载
跳转到setup处运行
xlanchen@2007.9.13 Linux Operating System Analysis 25
I386内核的启动
启动方式
软盘启动:从bootsect开始运行
硬盘启动:从setup开始运行
在进入bootsect.S的源代码讲解之前,我们先
看一下加载i386内核的内存布局图
xlanchen@2007.9.13 Linux Operating System Analysis 26
硬件角度:
I386实模式下的内存布局图
ROM-BIOS
0xF0000
0xC0000 VIDEO-BIOS
VRAM
0xA0000
1-MB
RAM
xlanchen@2007.9.13 Linux Operating System Analysis 27
0x00000
I386内核从实模式开始启动运行
首先看一下什么是实模式
实模式是为了兼容早期的CPU而设置的
i386系统总是始于实模式
实模式下
地址总线:20位
内存范围:0~1MB
逻辑地址 = 段地址 + 段内偏移
段地址 = 段寄存器中的值*16 (或左移4位)
段寄存器长度:16bit
xlanchen@2007.9.13 Linux Operating System Analysis 28
加载I386内核的内存布局图
zImage/Image的内核加载器所使用的经
典的内存布局(1M=0x100000)
低装载情况
xlanchen@2007.9.13 Linux Operating System Analysis 29
软盘启动,bootsect.S
0x7c000x90000
0x7c00, BIOS
0x90000, lilo
堆栈,0x3ff4(0x4000-12), 向下增长
磁盘参数表,12Bytes,0x3ff4~0x4000
显示“Loading”
Setup0x90200
系统
小内核,0x10000(64KB处),低装载
大内核,0x100000(1MB处),高装载
setup
xlanchen@2007.9.13 Linux Operating System Analysis 30
硬盘启动,两阶段引导
装载LILO(LInuxLOader)
第一个扇区
…
装载LINUX
Bootsect.S0x90000
Setup.S0x90200
系统
0x10000
0x100000
跳转到setup
xlanchen@2007.9.13 Linux Operating System Analysis 31
启动第一步,小结
总之,在跳转到setup的时候,内存里面的代
码布局为
0x90000:bootsect
0x90200:setup
低装载:0x10000:带解压的vmlinux
高装载:0x100000:带解压的bvmlinux
实模式下的内核头结构
包括bootsect的最后和setup开始的位置
从bootsect的偏移0x1F1开始,具体描述参见
documentation/i386/boot.txt
xlanchen@2007.9.13 Linux Operating System Analysis 32
Setup:0x90200
初始化硬件设备并为内核程 若低装载,将系统移动到
序的执行建立环境 0x1000处(4KB处)
内存检测 否则,不必
键盘 临时IDT和临时GDT
视频 FPU
磁盘控制器 PIC, 16个硬件中断中断向
量32~47
IBM微通道总线MCA
实模式保护模式
PS/2设备(总线鼠标)
Startup_32
APM BIOS
xlanchen@2007.9.13 Linux Operating System Analysis 33
在compressed/head.S和head.S中都定义了
startup_32
但是head.S中,被压缩在vmlinux中还没有解压缩
只有compressed/head.S的startup_32是可用的
zImage中,在0x1000处
bzImage中,在0x100000处
xlanchen@2007.9.13 Linux Operating System Analysis 34
Compressed/head.S
Startup_32
初始化段寄存器和一个临时堆栈
初始化BSS段
解压缩
高装载或低装载解压缩0x100000(1MB)
跳转到0x100000处
xlanchen@2007.9.13 Linux Operating System Analysis 35
解压缩后,vmlinux在0x100000处
根据vmlinux.lds,vmlinux的地址被链接为
0xc0000000+0x100000处
如何正确运行呢?
此时仍然是实模式,还没有进入保护模式、分页、
映射好
没有长跳转,只使用采用相对地址的近距离跳转
xlanchen@2007.9.13 Linux Operating System Analysis 36
Head.S
Startup_32
初始化段寄存器
建立进程0的内核堆栈
Setup_idt
拷贝系统参数
识别处理器
GDT、IDT
Start_kernel
xlanchen@2007.9.13 Linux Operating System Analysis 37
与内存相关的一些概念
在实模式下,地址总线20位,访存范围为1MB,
物理地址使用段址:偏移的方式表示
段址保存在段寄存器中,段寄存器有:
cs/ds/es/fs/gs
16位寄存器,偏移也是16位,因此最大段长为
216=0x10000=64KB
物理地址= 段寄存器×16+偏移
xlanchen@2007.9.13 Linux Operating System Analysis 38
保护模式下,地址总线32位,访存范围为4GB
原来的段寄存器现在被称作段选择子,与GDT
表配合使用
GDT表由gdtr指示其位置和长度
使用特殊的指令进行操作:sgdt/lgdt
xlanchen@2007.9.13 Linux Operating System Analysis 39
图示
Interrupt Descriptor
Table
descriptor
Global Descriptor
descriptor
Table
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
descriptor
GDTR descriptor
descriptor
descriptor
descriptor
IDTR
xlanchen@2007.9.13 Linux Operating System Analysis 40
查看setup.S和head.S中的gdt/ldt
一般装载gdt和idt之后,要重新装载段寄存器
cs、ds、es、fs、gs
cs通常通过一条长跳转指令装载
其他数据段寄存器直接设置
xlanchen@2007.9.13 Linux Operating System Analysis 41
控制寄存器(Control Registers)
CR0
CR1
CR2
CR3
与内存相关
xlanchen@2007.9.13 Linux Operating System Analysis 42
CR0
CR0, MSW register (Machine Status Word, 32-bit
version)
包含系统控制位,用于控制操作模式和状态
Instruction: lmsw PE-bit (Protection Enabled)
0 CPU is in real-mode,
LINUX’ setup.S:
1 CPU is in protected-mode
movw $1, %ax
lmsw %ax
jmp flush_instr // why?
flush_instr:
To turn on the PE-bit (enables protected-mode),
xlanchen@2007.9.13 Linux Operating System Analysis 43
CR1、CR2、CR3
CR1:保留
CR2:在缺页异常的时候,记录缺页地址
CR3:记录页目录所在的物理地址和两个标记(PCD &
PWT)
xlanchen@2007.9.13 Linux Operating System Analysis 44
作业2
i386实模式下是如何解决20位地址空间和16位
段寄存器之间的不匹配问题的?
i386保护模式下的段寄存器的内容与实模式下
段寄存器的内容一样么?如何解释?
简单叙述一下Linux的bzImage的软盘启动过程
xlanchen@2007.9.13 Linux Operating System Analysis 45