collect采用gpt生成，适用于mosaic结果的分析

Created2025-09-10Updated2025-11-26

#!/bin/bash

# 从管道读取 JSON 格式输入
input=$(cat)

# 检查 JSON 数据中是否包含 "vertices" 和 "edges"
if ! echo "$input" | jq -e '.vertices and .edges' > /dev/null; then
    echo "Error: JSON input must contain 'vertices' and 'edges' arrays."
    exit 1
fi

# 提取路径中的节点信息
path=$(echo "$input" | jq -r '.vertices[-1].stdout')
# 计算顶点 |V| 和边 |E| 数量
num_vertices=$(echo "$input" | jq '.vertices | length')
num_edges=$(echo "$input" | jq '.edges | length')

# 生成唯一的输出计数
unique_outputs=1

# 输出格式
echo "$path"
echo "|V| = $num_vertices, |E| = $num_edges."
echo "There are $unique_outputs distinct outputs."

gdbinit

Created2025-09-10Updated2025-11-26

让gdb启动时就打开tui

编写gdbinit文件

所以先在home目录下设置gdbinit

然后执行

1	source ~/.gdbinit

hanoi

Created2025-09-10Updated2025-11-26

hanoi

每个Frame（栈帧）都有自己的变量，pc是相互独立的，指示自身栈帧下一步要执行什么

每次call，入栈，把pc置为0，在while(1)开头再指向top

每次执行完case语句，都把pc加1，不一定是栈顶的

把递归的分解为6步，逐步执行，case3移动一个不需要保存，在case6加1就行

int hanoi(int n, char from, char to, char via) {
    Frame stk[64];
    Frame *top = stk - 1;

    // Function call: push a new frame (PC=0) onto the stack
    #define call(...) ({ *(++top) = (Frame){.pc = 0, __VA_ARGS__}; })
    
    // Function return: pop the top-most frame
    #define ret(val) ({ top--; retval = (val); })


    // The last function-return's value. It is not obvious
    // that we only need one retval.
    int retval = 0;

    // The initial call to the recursive function
    call(n, from, to, via);

    while (1) {
        // Fetch the top-most frame.
        Frame *f = top;
        printf("pc=%d\n",  f->pc);
       
       
        if (top < stk) {
           // No top-most frame any more; we're done.
            break;
        }

        // Jumps may change this default next pc.
        int next_pc = f->pc + 1;
        
        // Single step execution.

        // Extract the parameters from the current frame. (It's
        // generally a bad idea to reuse variable names in
        // practice; but we did it here for readability.)
        int n = f->n, from = f->from, to = f->to, via = f->via;
        
        switch (f->pc) {
            case 0:
                if (n == 1) {
                    printf("%c -> %c\n", from, to);
                    ret(1);
                }
                break;
            case 1: call(n - 1, from, via, to); break;
            case 2: f->c1 = retval; break;
            case 3: call(1, from, to, via); break;
            case 4: call(n - 1, via, to, from); break;
            case 5: f->c2 = retval; break;
            case 6: ret(f->c1 + f->c2 + 1); break;
            default: assert(0);
        }

        f->pc = next_pc;
    }

    return retval;
}

ostep28.14使用pack和unpack

Created2025-09-10Updated2025-11-26

ostep28.14使用pack和unpack

存在自旋，但是自旋仅在guard保护修改flag和队列中，比用户的临界区短

1  typedef struct __lock_t {
2      int flag;
3      int guard;
4      queue_t *q;
5  } lock_t;

6  void lock_init(lock_t *m) {
7      m->flag = 0;
8      m->guard = 0;
9      queue_init(m->q);
10 }

11 void lock(lock_t *m) {
12     while (TestAndSet(&m->guard, 1) == 1) // acquire guard lock by spinning
13         ; // 自旋直到获取到guard锁
14     if (m->flag == 0) { // 如果flag为0，表示锁未被占用
15         m->flag = 1; // 获取锁
16         m->guard = 0; // 释放guard锁
17     } else { // 锁已被占用
18         queue_add(m->q, gettid()); // 将当前线程加入等待队列
19         m->guard = 0; // 释放guard锁
20         park(); // 将线程挂起，进入睡眠状态
21     }
22 }

23 void unlock(lock_t *m) {
24     while (TestAndSet(&m->guard, 1) == 1) // acquire guard lock by spinning
25         ; // 自旋直到获取到guard锁
26     if (queue_empty(m->q)) { // 如果队列为空，表示没有等待线程
27         m->flag = 0; // 释放锁
28     } else {
29         unpark(queue_remove(m->q)); // 唤醒等待队列中的下一个线程
30     }
31     m->guard = 0; // 释放guard锁
32 }

guard的作用是保护flag和队列的修改，flag保护临界区

在unlock中，唤醒等待线程后，不需要设置flag=1,这样直接将锁从解锁的线程传给了被唤醒的线程。

是的，在原文的代码实现中，线程被唤醒后就直接进入临界区

存在的问题就是唤醒的丢失，因为A线程加入队列后如果切换到释放锁的线程B，线程B唤醒A后，A继续执行然后睡眠，但是此时等待队列已经没有A了，所以会造成死锁

使用setpark,如果setpark后切换到另一个线程，调用unpark释放后，返回lock函数，pack会直接返回而不再睡眠

void lock(lock_t *m) {
    while (TestAndSet(&m->guard, 1) == 1)
        ;  // 自旋等待获取guard锁
    
    if (m->flag == 0) {  // 如果锁未被占用
        m->flag = 1;     // 获取锁
        m->guard = 0;    // 释放guard锁
    } else {             // 如果锁被占用
        queue_add(m->q, gettid());  // 将当前线程加入等待队列
        setpark();                  // 设置park状态，防止丢失唤醒
        m->guard = 0;               // 释放guard锁
        park();                     // 挂起线程，等待被唤醒
        // 唤醒后继续执行
    }
}

pstree

Created2025-09-10Updated2025-11-26

1.解析参数

2.创建根节点

3.遍历进程文件建树，用read_proc_info读取父进程，创建节点

char name[100] = "\0"; 
            pid_t p = 0; 
            pid_t pp = 0; 
            getPPid(stat_detail, &p, name, &pp);

            ProcessNode* node = creatnode(name, p, pp);
            ProcessNode* proc = process_table[pp];

            
            if(pp == 0)continue;//加上这一段就只能打印init

            proc -> children[proc -> childrencount++] = node;

本意是想取掉一个多余的0号进程，不打印

调试发现是出现了段错误，把print_tree改成打印table[0]就可以了

具体错误有待查询

打印节点

加前缀

init(Ubuntu-22.
      ├──── init
      ├──── SessionLeader
      │     └──── Relay(17)
      │           ├──── zsh
      │           │     └──── pstree-64
      │           ├──── zsh
      │           │     └──── gitstatusd-linu
      │           ├──── zsh
      │           └──── zsh
      └──── SessionLeader

分三种情况

1.没有父进程，不加前缀

2.有父进程，但没有兄弟进程或者是兄弟进程中的最后一个└────

3.有父进程，有兄弟进程，且不是最后一个├────

根据深度，加|或者空格

可以选择打印传入参数的子进程

修改printf函数之后就可以了

void print_tree(ProcessNode* node, int level,char* prefix) {
    if (node -> childrencount == 0) return;

    for(int i = 0;i < node -> childrencount;i++)
    {   
        
        printf("%s", prefix);//打印前缀
        assert(node -> children[i] != NULL);
         //printf("%s(%d)\n", node->children[i] -> name,node->children[i] -> pid);
        if (level > 0) //如果不是根节点，若是最后一个孩子，则打印└────，否则打印├────
            printf(node -> childrencount == (i + 1) ? "└──── " : "├──── ");
   
        //参数为true时，打印pid
        if (showpid == 1) 
        {
            printf("%s(%d)\n", node->children[i] -> name,node->children[i] -> pid);
        } 
        else 
        {
            printf("%s\n", node->children[i] -> name);
        }

        char new_prefix[MAX_SIZE];
        strncpy(new_prefix, prefix, sizeof(new_prefix) - 1);
        if (level > 0)//如果不是根节点，若是最后一个孩子，则前缀加空格，否则加竖线 
        {
            strcat(new_prefix, node->childrencount == (i + 1) ? "      " : "│     ");
        }

        print_tree(node->children[i], level + 1, new_prefix);//递归打印孩子的孩子节点
    }
 
}

vptr和tbl，typedef

Created2025-09-10Updated2025-11-26

vptr和tbl，typedef

动态绑定

函数指针

#include <iostream>
using namespace std;
class base{
    int a;
    public:
    base(int x):a(x){}
    base(){}
    ~base(){}

    virtual void print(){cout << "base print" << endl;}
};

class derived: public base{
    public:
    derived(int x):base(x){}
    ~derived(){}
    virtual void print(){cout << "derived print" << endl;}
};
int main(void)
{
    derived d(1);

    base* p = new base(1); 
    p->print();

    base c ;
    typedef void (*Fun)(void);
    Fun pFun = NULL;

    cout << "虚函数表地址" << (int*)(&c) << endl;   
    // 其实就是虚指针vbtr的值,因为vbtr的地址和对象的地址相同

    cout << "虚函数表: 第一个函数地址" << (int*)*(int*)(&c) << endl;

    pFun = (Fun)*((int*)*(int*)(&c));
    pFun();

return 0;
}

1
2
3

Fun pFun = NULL;：这里，pFun是一个Fun类型的指针，也就是一个函数指针。它被初始化为NULL，表示它不指向任何函数。

pFun = (Fun)*((int*)*(int*)(&c));：这里，pFun被赋值为c对象的虚函数表中的第一个函数的地址。这行代码首先获取c的地址&c，然后将其转换为int*类型，解引用得到虚函数表的地址，再次将其转换为int*类型，解引用得到第一个虚函数的地址，最后将其转换为Fun类型。

typedef

C/C++ typedef用法详解（真的很详细）-CSDN博客

1 2	type ()(....)函数指针 type ()[]数组指针

理解复杂声明可用的“右左法则”：
从变量名看起，先往右，再往左，碰到一个圆括号就调转阅读的方向；括号内分析完就跳出括号，还是按先右后左的顺序，如此循环，直到整个声明分析完。举例：
int (*func)(int *p);
首 先找到变量名func，外面有一对圆括号，而且左边是一个*号，这说明func是一个指针；然后跳出这个圆括号，先看右边，又遇到圆括号，这说明 (*func)是一个函数，所以func是一个指向这类函数的指针，即函数指针，这类函数具有int*类型的形参，返回值类型是int。
int (*func[5])(int *);
func 右边是一个[]运算符，说明func是具有5个元素的数组；func的左边有一个*，说明func的元素是指针（注意这里的*不是修饰func，而是修饰 func[5]的，原因是[]运算符优先级比*高，func先跟[]结合）。跳出这个括号，看右边，又遇到圆括号，说明func数组的元素是函数类型的指 针，它指向的函数具有int*类型的形参，返回值类型为int。

1. 原声明：int *(*a[5])(int, char*);
变量名为a，直接用一个新别名pFun替换a就可以了：
typedef int *(*pFun)(int, char*); 
原声明的最简化版：
pFun a[5];

2. 原声明：void (*b[10]) (void (*)());
变量名为b，先替换右边部分括号里的，pFunParam为别名一：
typedef void (*pFunParam)();
再替换左边的变量b，pFunx为别名二：
typedef void (*pFunx)(pFunParam);
原声明的最简化版：
pFunx b[10];

3. 原声明：doube(*)() (*e)[9]; 
变量名为e，先替换左边部分，pFuny为别名一：
typedef double(*pFuny)();
再替换右边的变量e，pFunParamy为别名二
typedef pFuny (*pFunParamy)[9];
原声明的最简化版：
pFunParamy e;

互斥

Created2025-09-10Updated2025-11-26

实现原子指令用到了什么，一小段的不可被打断的指令

自旋锁，把1交换出去，其他的线程只能交换出0，并不断循环交换，临界区结束了之后把1还回去

另一个线程就把锁换过来

如果lock unlock函数加上参数，就相当于可以设多个锁，试图得到同一把锁的线程就实现了互斥

lock(&status)

bool holding(spinlock_t *lk) {//当前是有锁状态，且锁的拥有者是当前cpu
    return (
        lk->status == LOCKED &&
        lk->cpu == &cpus[cpu_current()]
    );
}

要正确使用锁很难，要经常使用断言，检查中断是否符合预测assert，可以读读xv6源码

在用户态

用户程序sum++拥有锁，被操作系统中断了，切换到了其他程序，

其他各个线程都无法获得锁，要等操作系统切回去

在操作系统中

会中断来实现锁

在操作系统内核：

连续上两次锁，中断一次再上锁，无法获得锁，就发生死锁

正确性准则

单处理器上锁解锁前后，中断状态不可改变，原来是中断还是中断，原来不中断还是不中断

多处理器，

使用栈保存中断状态

为了实现自旋一定要中断吗？

在用户态

因为自旋锁资源浪费严重

互斥锁（mutex）的实现使用了syscall，具有较好的scalability

futex如果没有锁直接访问，fast path

如何唤醒被syscall挂起的线程？

06-并发控制：互斥 (1)

自己思考一下，想各种情况，修改后可以立即用model checker来验证

互斥 2)

关中断+自旋实现互斥

保存锁前中断状态

多线程

Created2025-09-10Updated2025-12-02

多线程

独立的栈，共享的内存空间

阅读thread.h源码

在thread-qa中

将thread.h移入文件夹，执行make报错找不到库

解决方法：设置TLIB_PATH路径为thread.h所在的文件夹

1	CFLAGS := -O1 -g -I$(TLIB_PATH)

解释

-I$(TLIB_PATH)：
- 这个选项指定了一个包含路径，该路径由 $(TLIB_PATH) 变量定义。
- $(TLIB_PATH) 可能在 Makefile 的其他地方定义，或者在运行 make 命令时通过环境变量传递。
- 编译器会在 $(TLIB_PATH) 指定的目录中查找头文件。
-I.：
- 这个选项指定当前目录（.）作为包含路径。
- 编译器会在当前目录中查找头文件。

多个进程读取写入

支付宝，第一个减去100，第二个在该进程没有减去的时候进行条件判断，也减去100，由于是unsigned long 结果变成很大的数

copilot解释

竞态条件的发生

共享变量：balance 是一个全局变量，多个线程可以同时访问和修改它。
线程创建：main 函数中创建了两个线程，分别执行 T_alipay 函数。
函数调用：每个线程调用 Alipay_withdraw(100)，尝试从 balance 中扣除 100。

竞态条件的具体过程

线程1和线程2同时检查 balance：
- 线程1检查 balance 是否大于等于 100，结果为真。
- 线程2也检查 balance 是否大于等于 100，结果也为真。
线程1和线程2同时进入 if 块：
- 线程1进入 if 块并调用 usleep(1)，暂时让出CPU。
- 线程2也进入 if 块并调用 usleep(1)，暂时让出CPU。
线程1和线程2同时修改 balance：
- 线程1从 balance 中减去 100，balance 变为 0。
- 线程2也从 balance 中减去 100，balance 无符号整数会溢出

如果是两个进程都循环加1加到10000，结果不会是20000

原代码反汇编

13ea:       48 8b 05 4f 2c 00 00    mov    0x2c4f(%rip),%rax       
# 4040 <sum>
13f1:       48 83 c0 01             add    $0x1,%rax
13f5:       48 89 05 44 2c 00 00    mov    %rax,0x2c44(%rip)

修改成一条汇编指令

1	13ea: 48 ff 05 4f 2c 00 00 incq 0x2c4f(%rip)

改成一条指令，如果在一个处理器上还能正确，但是在多处理器上还会错误。

看着是一条指令，实际上不是原子指令。

printf是线程安全的

因为汇编指令取值，在中间寄存器加1后可能会中断，再放入变量对应地址中，结果可能就只是加一个1，而不是两个1

最小可以小于10000，可以改成汇编指令

为什么是2？

每个进程有一个n次循环，n个进程

在关键进程中，最后一步store，之前，已经循环了n-1次了，这两次的最小值为1（进程A第一个循环store()时，关键进程第n-1个循环正好结束，进程A，store后sum=1）关键进程执行前两步，然后关键进程等待其他进程结束后执行store(2,sum)

编译器优化，可能会隐藏并发的bug(都假设状态迁移是原子性，顺序执行)

O1优化sum=100000000

1
2
3

load(sum + N)
;循环N次
store(num)

O2优化sum=200000000

1
2
3

0000000000001260 <T_sum>:
    1264:       48 81 05 d1 2d 00 00    addq   $0x5f5e100,0x2dd1(%rip)       
 ;改成了一条指令，两个进程碰在一起的概率很低

处理器也是编译器，所以单线程的处理器可能会优化，调换程序执行的顺序（在结果不变的情况下）

也是状态机，流水线，读写不冲突就能同时执行

所以……相对论？

共享内存只是一个简化的假象

mem-modle

一个是写Y读X，一个是写X读Y，得按特定顺序才能输出1，1，所以很少

arm与x86的内存模型不同，对于多线程的程序模拟难度大

实现库函数printf

Created2025-09-10Updated2025-11-26

实现库函数printf

1	int printf (const char *format, ...);

这个程序除了调用的库函数不同 (例如没有 stdio.h；多了 am.h) 之外，它就是一个完全符合 C 标准的普通程序，但因为没有操作系统和标准库的支持，我们需要编写所有的库函数。例如，printf 也来自我们的代码，它调用了 AbstractMachine 提供的 putch API:

嵌套类

Created2025-09-10Updated2025-11-26

Club嵌套Coach

class Coach{
    string name;
    int winRate;
public:
    Coach(string n, int wr){
        name=n; winRate=wr;
    }
    void show();
};
class Club{
    string name;
    Coach c;
    int year;
public:
    Club(string n1, int y, string n2, int wr);
    void show();
};

Club的初始化和show函数要利用Club类中的东西

Club::Club(string n1,int y,string n2,int wr):c(n2,wr){
    name = n1;
    year = y;
}
void Club::show(){
    cout << name << " " << year << "\n";
    c.show();
}

同样，在下面Circle调用内部Point类型的变量，要有Point中的get函数配合才能取出相应的x,y

#include<bits/stdc++.h>
using namespace std;
class Point{
    private:
        double x,y;
    public:
        Point(int n,int m):x(n),y(m){}
    double get_x(){return x;}
    double get_y(){return y;}
};
class Circle{
        private:
            Point o;
            double r;
        public:
    Circle(Point p,double x):o(p){r = x;}
            bool isPointIn(Point p){
                double a = o.get_x();
                double b = o.get_y();
                double c = p.get_x();
                double d = p.get_y();
                double x = sqrt((a - c) * (a - c) + (b - d) * (b - d));
                if(x < r)return true;
                return false;
            }   
};