博客¶

2024年9月12日
分类于 hardware
需要 9 分钟阅读时间

浅谈乱序执行 CPU（三：前端）

本文的内容已经整合到知识库中。

背景

这是浅谈乱序执行 CPU 系列博客的第三篇。

本文主要讨论处理器前端的部分。

本系列的所有文章：

2024年9月10日
分类于 hardware
需要 7 分钟阅读时间

三星 Exynos CPU 微架构学习笔记

背景

ISCA 2020 的一篇文章 Evolution of the Samsung Exynos CPU Microarchitecture 非常详细地解析了三星 Exynos 自研 CPU 微架构的演进历史。本文是对这篇论文的学习和整理的笔记。

2024年9月4日
分类于 hardware
需要 11 分钟阅读时间

内存模型和内存序

背景

内存模型和内存序是一个贯穿软硬件实现的概念，你可以在 CPU 微架构，总线，到汇编指令，编译器和编程语言中看到它们。本文主要来探讨这些问题。

2024年9月1日
分类于 hardware
需要 12 分钟阅读时间

Qualcomm Oryon 微架构评测

背景

最近借到一台 Surface Laptop 7 可以拿来折腾，它用的是高通 Snapdragon X Elite 处理器，借此机会测试一下这个微架构在各个方面的表现。

2024年8月2日
分类于 hardware
需要 4 分钟阅读时间

分支预测的 2-taken 和 2-ahead

背景

随着 Zen 5 的推出，更多 Zen5 的架构设计细节被公开，可以看到 Zen 5 前端出现了令人瞩目的变化：引入了 2-taken, 2-ahead 分支预测的设计。这是什么意思？它架构上是怎么实现的？可以带来哪些性能提升？

2024年7月30日
分类于 hardware
需要 3 分钟阅读时间

在 Surface Laptop 7 上运行 Debian Linux

背景

最近借到一台 Surface Laptop 7 可以拿来折腾，它用的是高通 Snapdragon X Elite 处理器，跑的是 Windows on Arm 系统。但作为 Linux 用户，肯定不满足于 WSL，而要裸机上安装 Linux。由于这个机器太新，所以安装的过程遇到了很多坎坷。

2024年4月7日
分类于 software
需要 7 分钟阅读时间

开发一个链接器（4）

前言

这个系列的前三篇博客实现了一个简单的静态链接器，它可以输入若干个 ELF .o 文件，输出 ELF 可执行文件或者动态库。接下来，我们要进一步支持动态库，不仅可以生成动态库，还支持让动态库参与到静态链接当中。

2024年4月6日
分类于 software
需要 7 分钟阅读时间

开发一个链接器（3）

前言

这个系列的前两篇博客实现了一个简单的静态链接器，它可以输入若干个 ELF .o 文件，输出 ELF 可执行文件。接下来，我们进一步支持动态库：输入若干个 ELF .o 文件，输出 ELF 动态库。

2024年3月30日
分类于 software
需要 6 分钟阅读时间

开发一个链接器（2）

前言

这个系列的第一篇博客实现了一个最简单的静态链接器，它可以输入单个 ELF .o 文件，输出 ELF 可执行文件。接下来，我们需要把它升级到支持输入两个或者更多的 ELF .o 文件。

2024年2月18日
分类于 software
需要 7 分钟阅读时间

开发一个链接器（1）

前言

无论是在课程中还是实践中，都经常和链接器打交道。在这个过程中，大概了解了它的工作原理，对于常见的错误可以知道大概是怎么一回事，以及如何解决。但最近遇到一些涉及到链接器内部的问题，才发现自己对链接器的内部的了解还是比较匮乏的。因此想到自己开发一个链接器，在开发的过程中学习。

2024年1月25日
分类于 software
需要 2 分钟阅读时间

Chromium 构建与移植

背景

Google Chrome 也用了很长时间了，但是一直没有尝试过构建 Chromium，这次趁着往 LoongArch 移植 Chromium 的机会，学习了一下 Chromium 的构建。

2023年12月8日
分类于 hardware
需要 3 分钟阅读时间

VIPT 与缓存大小和页表大小的关系

VIPT（Virtual Index Physical Tag）是 L1 数据缓存常用的技术，利用了虚拟地址和物理地址的 Index 相同的特性，得以优化 L1 数据缓存的读取。但是 VIPT 的使用，与页表大小和 L1 数据缓存大小都有关系。这篇博客探讨一下，VIPT 技术背后的一些问题。

2023年12月7日
分类于 software
需要 3 分钟阅读时间

反向代理的 Partial Transfer 问题

反向代理已经是无处不在，但是如果反向代理没有根据使用场景调优，或者出现了一些异常，可能会带来不好的用户体验，并且现象十分奇怪，例如访问某 GitLab 实例的时候，偶尔会出现页面加载不完整的情况。

这些问题困扰了我们很久，到最后才发现，原来问题在反向代理上。下面就来回顾一下事情的经过。

2023年12月5日
分类于 software
需要 2 分钟阅读时间

包管理器打包命令速查

随着 Linux 使用逐渐深入，开始尝试参与到一些发行版/包管理器的维护当中。在此记录一下打包相关命令，方便自己速查。

2023年11月26日
分类于 software
需要 2 分钟阅读时间

背景

mkdocs-material 支持 Instant Navigation：启用了以后，在网页里点击其他页面的时候，它会用类似 SPA 的方法，去 fetch 新的网页，然后原地替换，而不是让浏览器跳转过去，可以提升用户体验。

但是在用这个功能的时候，会发现其实并不是那么简单。。。

2023年11月23日
分类于 software
需要 2 分钟阅读时间

在 Apple Silicon macOS 上跑 Linux 虚拟机 + Rosetta

背景

最近需要跑某个 x86 only 且需要 GUI 的程序，以往都是跑在远程 Linux/Windows 机器上再远程桌面去使用。最近看到了一些比较成熟的在 macOS 上跑 Linux 虚拟机 + Rosetta 的办法（M1 Mac で Vivado が動いた！），因此记录下来。

2023年10月31日
分类于 hardware
需要 2 分钟阅读时间

Apple 处理器

本文记录了 Apple 各处理器的参数。

2023年10月17日
分类于 software
需要 5 分钟阅读时间

编译 CUDA 程序的主要工具是 NVIDIA 提供的闭源编译器 NVCC，但实际上，NVCC 是基于 LLVM 开发的（来源：NVIDIA CUDA Compiler），NVIDIA 也把 NVCC 其中一部分逻辑贡献给了 LLVM 上游，使得 Clang 也可以在 CUDA 的配合下编译 CUDA 程序。这篇博客尝试研究 Clang/LLVM 如何实现 CUDA 程序的编译，主要是 Clang 前端部分，后端部分，也就是从 LLVM IR 到 NVPTX 的这一步还没有进行深入的研究。

2023年10月3日
分类于 os
需要 6 分钟阅读时间

WSL2 内部实现探究

背景

最近看到 Windows Subsystem for Linux September 2023 update 声称 WSL2 最新的预览版本支持让 Linux 和 Windows 一定程度上共享网络地址空间，就像 WSL1 那样：

IPv6 support
Connect to Windows servers from within Linux using the localhost address 127.0.0.1
Connect to WSL directly from your local area network (LAN)
Improved networking compatibility for VPNs
Multicast support

因此比较想知道这是怎么做到的，但目前我手上还没有预览版本的 windows，因此目前先研究 WSL2 已有的功能是如何实现的，未来再回来更新这一部分。