19-可执行文件：静态链接和加载

Created2025-09-10Updated2025-11-26

19-可执行文件：静态链接和加载

execve（加载）把当前的进程重置成指定可执行文件的初始状态

可执行文件：一个状态机初始状态的数据结构

里面规定了加载该可执行文件后地址空间里该有什么数据（寄存器，代码段等）

状态：内存和寄存器

elf为了性能丧失了阅读友好性

magic number是什么

Magic number一般是指硬写到代码里的整数常量，数值是编程者自己指定的，其他人不知道数值有什么具体意义，表示不明觉厉，就称作magic number。

a.out

设计一个可读的可执行文件，需要什么（代码，符号，重定位）

FLE 加载器：只做一件事

将一段字节序列复制到地址空间中
- 赋予可读、可写、可执行权限
然后跳转到 _start 执行

ELF 并没有多做多少

将多段字节序列复制到地址空间中
- 分别赋予可读/可写/可执行权限
然后跳转到指定的 entry (默认为 _start) 执行

#!/bin/bash

1 2	#!A B C THIS

argc[0] = A

argv[1] = B C

argv[2]该程序的名称

20-动态链接和加载

Created2025-09-10Updated2025-12-02

20-动态链接和加载

libc.o静态链接

容易浪费空间

libc.so动态链接

生成位置无关代码，使用中间的table存放函数地址

借助编译器完成

用多个线程链接库，验证只有一个副本

是链接的同一份

地址空间是怎么分配的（虚拟内存）

动态链接（查表）

编译时，函数调用 = 查表(把函数调用替换成查表)

编译时，动态链接库调用 = 查表

1	call *TABLE[printf@symtab]

链接时，收集所有符号，“生成” 符号信息和相关代码：

#define foo@symtab     1
#define printf@symtab  2 
... 
void *TABLE[N_SYMBOLS]; 
void load(struct loader *ld) {    
    TABLE[foo@symtab] = ld->resolve("foo");    
    TABLE[foo@printf] = ld->resolve("printf");    
    ... 
}

LOAD("libc.dl")
LOAD("libhello.dl")
IMPORT(hello)
IMPORT(exit)
EXPORT(_start)

gdb过程dlbox main.s

加载符号表，递归调用dlopen,调用libc.dl，导出符号，

putchar,exit填到全局的符号表，

解析第二个符号，libhello.dl

….

动态解析hello,hello不在main.dl里，是?

调用dlsym检查符号表，找到hello把地址填入符号表

执行DSYM(exit)

1	#define DSYM(sym) *sym(%rip)

找到空位把符号填入符号表

前面的存放地址和函数名的表项，就是 GOT (Global Offset Table)

因为call 的偏移量是64位，跳不到远处

所以使用plt,作为中转，先跳到plt中，plt中存放GOT对应函数的地址

再次跳转到对应函数

数据的链接，plt怎么解决数据链接的问题

get_x会查表

get_y直接得到地址（hidden）

编译器默认extern变量来自另外一个共享库单元（保守）

gpt对objdump反汇编的分析

总结

变量 x：
- 默认可见性（visibility("default")）。
- 使用 mov 指令，通过符号表获取地址。
- 可被其他模块或共享库访问。
变量 y：
- 隐藏可见性（visibility("hidden")）。
- 使用 lea 指令，直接计算地址，无需符号表查找。
- 仅在当前模块内部可见，无法被外部访问。
性能影响：
- 隐藏符号（y）链接效率更高，因为不需要符号表查找。
- 默认可见性符号（x）灵活性更强，但动态链接时可能会引入额外开销。

22-进程的实现 (虚拟地址空间；UNIX 和 xv6)

Created2025-09-10Updated2025-11-26

22-进程的实现 (虚拟地址空间；UNIX 和 xv6)

1024叉树

32bit，10bit+10bit+12bit，12bit放访问信息

一个4KB页面,一个放一个4B的指针，总共2^1024

绝大部分节点都是空的,下一层也类似（局部性原理）

64bit，4KB的页面，一项8B，总共有512项，不是很整齐

映射不需要先载入，只需要一个数据结构记录访问权限

到用指针访问时，发生缺页中断，如果合法访问，则改变f，映射一页

指针单点访问地址空间，一段时间后就能记录哪里能访问，哪里不能访问，把不能访问的释放掉，放到磁盘上

swap机制，闲置页面放到磁盘上，释放内存

可以使所有进程使用的内存总和比物理内存大

fork系统调用

fork() 在进行状态机复制时，虽然理论上需要做出完整的状态复制，但本着 “复制的数据可能立即被浪费掉” 的观察，操作系统希望只在 “不得不复制” 时才复制。

现代操作系统会维护页面的共享情况，并在 fork 后将父子进程的地址空间都标记为 read-only，而当双方中的任何一个进程写入发生 page fault 时，才复制一页。对于连续的 fork()，则会产生多个进程共享页面的情况。

服务器的容错，可以用fork以很小的代价做快照

21-系统调用、中断和上下文切换

Created2025-09-10Updated2025-11-26

21-系统调用、中断和上下文切换

动态链接，stderr和int x的调用

处理器和中断

中断和系统调用都是跳转到某段操作系统代码

syscall的代码顺带关中断，节省一条指令

与掩码（MASK）相与可以清零指定位

24-状态机模型的应用 (图灵机、Game of Life、状态机思想

Created2025-09-10Updated2025-11-26

24-状态机模型的应用 (图灵机、Game of Life、状态机思想

要实现状态机的退回

只需要记录“不确定因素”，syscall的前后diff就可以

其他寄存器变化都是固定的

23-处理器调度 (xv6 上下文切换；处理器调度：机制和策略)

Created2025-09-10Updated2025-11-26

23-处理器调度 (xv6 上下文切换；处理器调度：机制和策略)

由用户态，执行syscall

跳转到内核态代码，寄存器保存，切换页表和栈

调度策略

1	taskset -c 3 nice -n 19 yes > /dev/null & taskset -c 3 nice -n 9 yes > /dev/null

nice值相差10，占用cpu时间相差1倍

上下文切换是机制，策略是选择哪个进程执行

动态优先级，CPU密集型的优先级逐渐降低，交互型的优先级逐渐增加

动态优先级实现的虚拟时间是什么原理，为什么“好人”和“坏人”会相差几倍

进程的nice值越小（优先级越高），权重越大，在实际运行时间相同的情况下，虚拟运行时间越短，进程累计的虚拟运行时间增加得越慢，在红黑树中向右移动的速度越慢，被调度器选中的机会越大，被分配的运行时间相对越多。随着优先级高进程的虚拟运行时间增长，低优先级的进程也会有机会被调度

/*
 * Nice levels are multiplicative, with a gentle 10% change for every
 * nice level changed. I.e. when a CPU-bound task goes from nice 0 to
 * nice 1, it will get ~10% less CPU time than another CPU-bound task
 * that remained on nice 0.
 *
 * The "10% effect" is relative and cumulative: from _any_ nice level,
 * if you go up 1 level, it's -10% CPU usage, if you go down 1 level
 * it's +10% CPU usage. (to achieve that we use a multiplier of 1.25.
 * If a task goes up by ~10% and another task goes down by ~10% then
 * the relative distance between them is ~25%.)
 */
static const int prio_to_weight[40] = {
 /* -20 */     88761,     71755,     56483,     46273,     36291,
 /* -15 */     29154,     23254,     18705,     14949,     11916,
 /* -10 */      9548,      7620,      6100,      4904,      3906,
 /*  -5 */      3121,      2501,      1991,      1586,      1277,
 /*   0 */      1024,       820,       655,       526,       423,
 /*   5 */       335,       272,       215,       172,       137,
 /*  10 */       110,        87,        70,        56,        45,
 /*  15 */        36,        29,        23,        18,        15,
};

Linux CFS调度器 vruntime 的计算_linux vruntime-CSDN博客

CFS，完全公平调度，记录每个进程运行时间，每次都切换到运行时间最少的进程。

红黑树

6.s081debug kernel

Created2025-09-10Updated2025-11-26

6.s081debug kernel

在vscode配置好后无法debug用户程序，不能打断点

在debug console执行-exec file user/_ls

qemu-gdb debug指南之can not access memory解决！ - 知乎 (zhihu.com)

当你的xv6 kernel已经运行起来的时候，你想往一个用户程序打断点，你只能先加载他的符号表，然后将断点打在main函数的入口，然后在xv6 调用该程序，触发main函数断点，然后才可以在任意一行打断点。记住顺序不能乱。

解决方案，先暂停程序，然后在debug console中输入

1	-exec file user/_

加载该程序文件，然后打断点，运行程序debug

=运算符重载

Created2025-09-10Updated2025-09-11

Polynomial& Polynomial::operator=(const Polynomial& p){
		if(this == &p) return *this;
		delete[] coefficients;
		size = p.size;
		coefficients = new double[size];
		for(int i = 0; i < size; i++){
			coefficients[i] = p.coefficients[i];
		}
		return *this;
}

多项式类的赋值

要考虑 a = b = c 这种情况，所以返回reference类型

C++部分知识点

Created2025-09-10Updated2025-11-26

关于inline函数

class Person
{
public:
	Person(const string &name)
	{
		Name = name;
	}
    void printName();
	//在类里面没有显式声明
private:
	string Name;
};
void Person::printName()//不是内联函数
{//在类外面也没有显式定义
	cout << Name << endl;
}

C++类里面的哪些成员函数是内联函数？_操作符函数是内联的吗-CSDN博客

关于友元类和友元函数

友元关系是单向的，不具有交换性。
友元关系不能传递
友元关系不能被继承，但对已有的方法来说访问权限不改变。
类A把类B声明为友元类，在前面要有前置声明

类A把类B中的函数声明为友元函数，在类A之前必须有类B的完整定义

class Date; // 前置声明
class Time
{
    friend class Date; 
    // 声明日期类为时间类的友元类，则在日期类中就直接访问Time类中的私有成员变量
public:
    Time(int hour, int minute, int second): _hour(hour), _minute(minute), _second(second)
    {}
 
private:
    int _hour;
    int _minute;
    int _second;
};
 
class Date
{
public:
    Date(int year = 1900, int month = 1, int day = 1): _year(year),                                     
    _month(month),_day(day)
    {}
    void SetTimeOfDate(int hour, int minute, int second)
    {
        // 直接访问时间类私有的成员变量
        _t._hour = hour;
        _t._minute = minute;
        _t.second = second;
    }
private:
    int _year;
    int _month;
    int _day;
    Time _t;
};

重载输出运算符设置为全局函数

为什么输出运算符重载不能是一个成员函数?而非得声明为友元？
原因如下：

1	返回值 operator运算符(参数列表){}

重载运算符时，函数声明在类内和类外是有区别的，比方说 + - * / 等需要2个操作数的运算符，当声明在类的外部时，则参数列表为2个参数，第一个参数为运算符左边的操作数，而第二个参数为操作符右边的操作数：如下

1	classType operator+(classType& left, classType& right);

而当函数声明在类的内部时，即为类的成员函数时，

1	classType operator+(classType& right );

而第一个操作数就是调用该操作符的对象的引用，第二个操作数是传进来的参数，所以，如果要重载<<运算符，一般写法是这样的

1	ostream& operator<<(ostream& os, const classType& obj);

则第一个参数是该运算符的第一个操作数，然而，却不是类对象，
所以当该类运算符重载时写在类的内部时，又为了访问类内除public外的其它变量或函数

C++中友元函数和成员函数的区别-CSDN博客

关于protected和private

在C++中，private和protected是两种不同的访问修饰符，它们控制类成员的访问权限。

private：私有成员只能被该类的成员函数和友元函数访问，不能被该类的对象或者任何其他类访问。
protected：受保护成员可以被该类的成员函数、该类派生出的子类的成员函数以及友元函数访问，但不能被该类的对象访问。

在你的代码中，object类的成员a是私有的，所以它只能被object类的成员函数和友元函数访问。如果你想让a能被object类派生出的子类访问，你应该将a声明为受保护的，例如：

class object {
public:
    object() {
        a = 0;
    }
protected:
    int a;
};

在这个例子中，a是受保护的，所以它可以被object类的成员函数、object类派生出的子类的成员函数以及友元函数访问。

虚函数和static互斥,static函数也不能加const

虚函数

与对象关联：虚函数是与具体的对象实例关联的，它们通过对象的虚函数表（vtbl）实现动态绑定。
需要对象上下文：调用虚函数时，需要知道具体对象的类型，以便调用正确的函数实现。这需要通过this指针来访问对象的状态和虚函数表。

静态成员函数

与类关联：静态成员函数是与类本身关联的，而不是与具体的对象实例关联的。
没有对象上下文：静态成员函数没有this指针，不能访问对象的非静态成员或虚函数表，因为它们在类层次上调用，而不是通过对象。

简单总结

虚函数：需要对象实例来确定调用哪个函数实现。
静态成员函数：不依赖任何对象实例，只能访问类的静态成员。

由于虚函数依赖于对象的上下文，而静态成员函数没有对象上下文，因此它们不能结合在一起使用。虚函数需要对象实例和虚函数表，而静态成员函数不具备这些特性，因此它们是互斥的。

为何static成员函数不能为const函数

当声明一个非静态成员函数为const时，对this指针会有影响。对于一个Test类中的const修饰的成员函数，this指针相当于Test const *, 而对于非const成员函数，this指针相当于Test *. 而static成员函数没有this指针，所以使用const来修饰static成员函数没有任何意义。 volatile的道理也是如此。

关于new运算符

new运算符做的三件事：获得一块内存空间、调用构造函数、返回正确的指针

New运算符的使用方法：

1、new() ：分配这种类型的一个大小的内存空间,并以括号中的值来初始化这个变量;

2、 new[] ：分配这种类型的n个大小的内存空间,并用默认构造函数来初始化这些变量;

char* p=new char[6]; strcpy(p,”Hello”);

3、当使用new运算符定义一个多维数组变量或数组对象时，它产生一个指向数组第一个元素的指针，返回的类型保持了除最左边维数外的所有维数。例如：

int *p1 = new int[10];

返回的是一个指向int的指针int*  

int (*p2)[10] = new int[2][10];

new了一个二维数组, 去掉最左边那一维[2], 剩下int[10], 所以返回的是一个指向int[10]这种一维数组的指针int (*)[10].  

int (*p3)[2][10] = new int[5][2][10];

 new了一个三维数组, 去掉最左边那一维[5], 还有int[2][10], 所以返回的是一个指向二维数组int[2][10]这种类型的指针int (*)[2][10].

4、创建类对象

1）new创建对象，pTest用来接收对象指针。new申请的对象，则只有调用到delete时才会执行析构函数，如果程序退出而没有执行delete则会造成内存泄漏：

CTest* pTest = new CTest(); delete pTest;

2）不用new，直接使用类定义申明，使用完后不需要手动释放，该类析构函数会自动执行：

CTest mTest;

3）使用普通方式创建的类对象，在创建之初就已经分配了内存空间。而类指针，如果未经过对象初始化，则不需要delete释放：

CTest* pTest = NULL;

作用域运算符::

::是运算符中等级最高的，它分为三种：全局作用域符，类作用域符，命名空间作用域符

全局作用

全局作用域符号：当全局变量在局部函数中与其中某个变量重名，那么就可以用::来区分如：

char zhou; //全局变量 
　　void sleep（） 
　　{ 
　　char zhou; //局部变量 
　　zhou(局部变量) = zhou(局部变量) *zhou(局部变量) ; 
　　::zhou(全局变量) =::zhou(全局变量) *zhou(局部变量); 
}

类作用

作用域符号::的前面一般是类名称，后面一般是该类的成员名称，C++为了避免不同的类有名称相同的成员而采用作用域的方式进行区分
　　如：A,B表示两个类，在A,B中都有成员member。那么
　　A::member就表示类A中的成员member
　　B::member就表示类B中的成员member

命名空间

“::”是作用域限定符或者称作用域运算符或者作用域操作符（scope operator）.例如命名空间

“::”作用：

1	namespace::name

:: 的另一种用法

直接用在全局函数前，表示是全局函数。

关于缺省值函数

在C++中，函数形参的缺省值（默认值）有以下规则：

缺省值必须从右向左连续设定。也就是说，如果一个参数有缺省值，那么它右边的所有参数都必须有缺省值。例如，以下函数声明是合法的：

1	void fun(int x, int y = 1, int z = 2);

但是，以下函数声明是非法的，因为y有缺省值，但是它右边的参数z没有缺省值：

1	void fun(int x, int y = 1, int z); // 非法

缺省值只能在函数声明时设定，不能在函数定义时设定。例如，以下代码是合法的：

// 在函数声明时设定缺省值
void fun(int x = 0);
// 函数定义
void fun(int x) {
  // ...
}
但是，以下代码是非法的，因为缺省值在函数定义时设定：
// 函数声明
void fun(int x);
// 在函数定义时设定缺省值
void fun(int x = 0) { // 非法
  // ...
}

如果函数在同一作用域内多次声明，那么它的每个参数的缺省值最多只能设定一次。但是，如果函数在不同的作用域内声明，那么在不同的作用域内可以给同一个参数设定不同的缺省值。

关于try和catch

多态

动态多态

运行时的多态存在于继承类中，通过虚函数现动态选择调用。

静态多态

静态多态是发生在编译时期的，通过模板和函数重载实现，相比动态多态不需派生关系。

C++文件操作

C++文件操作（2023最新详解）-CSDN博客

1、要打开一个输入文件流，需要定义一个 ifstream类型的对象。->Input-stream
2、要打开一个输出文件流，需要定义一个 ofstream类型的对象。->Output-stream
3、如果要打开输入输出文件流，则要定义一个 fstream类型的对象。->File-stream

**这3种类型都定义在头文件 **fstream里

1 2	ofstream ofs; //2、打开一个相应的文件流 ofs.open("mytest.txt"); //3、流与文件关联上

因为ifstream、ofstream和fstream这3个类都具有自动打开文件的构造函数，而这个构造函数就具有 open() 的功能。

因此，我们可以在创建流对象的时候就可以关联文件：ofstream myStream("myText.txt");

open函数的原型如下：

1	void open(char const *,int filemode,int =filebuf::openprot);

ios::in	打开文件进行读操作，这种方式可避免删除现存文件的内容
ios::out	打开文件进行写操作，这是默认模式
ios::ate	打开一个已有的输入或输出文件并查找到文件尾开始
ios::app	在文件尾追加方式写文件
ios::binary	指定文件以二进制方式打开，默认为文本方式
ios::trunc	如文件存在，将其长度截断为零并清除原有内容，如果文件存在先删除，再创建

三种继承

1.公有继承–public:（原样复制）

公有继承时，对基类的公有成员和保护成员的访问属性不变，派生类的新增成员只能访问基类的公有成员和保护成员（都一样）。派生类的对象只能访问派生类的公有成员（包括继承的公有成员），访问不了保护成员和私有成员**（公有继承的对象多了个访问继承的公有成员）**。

2.保护继承–protected

保护继承中，基类的公有成员和保护成员被派生类继承后变成保护成员，派生类的新增成员只能访问基类的公有成员和保护成员（都一样），派生类的对象只能访问派生类的公有成员。

3.私有继承–private

私有继承时，基类的公有成员和保护成员都被派生类继承下来之后变成私有成员，派生类的新增成员只能访问基类的公有成员和保护成员（都一样）。派生类的对象只能访问派生类的公有成员(这里和protected继承一样)。

关于多继承

C++多继承中的二义性问题_c++多重继承引起的二义性问题-CSDN博客

同名二义性

一个子类继承两个有同名数据成员的父类

路径二义性

一个子类继承两个父类，这两个父类又继承自同一个祖父类

class7自旋锁

Created2025-09-10Updated2025-11-26

在class7的自旋锁多核启动失败，只能单cpu

解决方法

修改/home/cgz/work/nju-os-workbench/abstract-machine/scripts/platform/qemu.mk

.PHONY: build-arg

smp        ?= 4//改这个
LDFLAGS    += -N -Ttext-segment=0x00100000
QEMU_FLAGS += -serial mon:stdio \
              -machine accel=tcg \
              -smp "$(smp),cores=1,sockets=$(smp)" \//改这里的sockets和cores
              -drive format=raw,file=$(IMAGE)

build-arg: image
	@( echo -n $(mainargs); ) | dd if=/dev/stdin of=$(IMAGE) bs=512 count=2 seek=1 conv=notrunc status=none

BOOT_HOME := $(AM_HOME)/am/src/x86/qemu/boot

image: $(IMAGE).elf
	@$(MAKE) -s -C $(BOOT_HOME)
	@echo + CREATE "->" $(IMAGE_REL)
	@( cat $(BOOT_HOME)/bootblock.o; head -c 1024 /dev/zero; cat $(IMAGE).elf ) > $(IMAGE)