2023¶

2023年12月8日
分类于 hardware
需要 3 分钟阅读时间

VIPT 与缓存大小和页表大小的关系

VIPT（Virtual Index Physical Tag）是 L1 数据缓存常用的技术，利用了虚拟地址和物理地址的 Index 相同的特性，得以优化 L1 数据缓存的读取。但是 VIPT 的使用，与页表大小和 L1 数据缓存大小都有关系。这篇博客探讨一下，VIPT 技术背后的一些问题。

2023年12月7日
分类于 software
需要 3 分钟阅读时间

反向代理的 Partial Transfer 问题

反向代理已经是无处不在，但是如果反向代理没有根据使用场景调优，或者出现了一些异常，可能会带来不好的用户体验，并且现象十分奇怪，例如访问某 GitLab 实例的时候，偶尔会出现页面加载不完整的情况。

这些问题困扰了我们很久，到最后才发现，原来问题在反向代理上。下面就来回顾一下事情的经过。

2023年12月5日
分类于 software
需要 2 分钟阅读时间

包管理器打包命令速查

随着 Linux 使用逐渐深入，开始尝试参与到一些发行版/包管理器的维护当中。在此记录一下打包相关命令，方便自己速查。

2023年11月26日
分类于 software
需要 2 分钟阅读时间

背景

mkdocs-material 支持 Instant Navigation：启用了以后，在网页里点击其他页面的时候，它会用类似 SPA 的方法，去 fetch 新的网页，然后原地替换，而不是让浏览器跳转过去，可以提升用户体验。

但是在用这个功能的时候，会发现其实并不是那么简单。。。

2023年11月23日
分类于 software
需要 2 分钟阅读时间

在 Apple Silicon macOS 上跑 Linux 虚拟机 + Rosetta

背景

最近需要跑某个 x86 only 且需要 GUI 的程序，以往都是跑在远程 Linux/Windows 机器上再远程桌面去使用。最近看到了一些比较成熟的在 macOS 上跑 Linux 虚拟机 + Rosetta 的办法（M1 Mac で Vivado が動いた！），因此记录下来。

2023年10月31日
分类于 hardware
需要 2 分钟阅读时间

Apple 处理器

本文记录了 Apple 各处理器的参数。

2023年10月17日
分类于 software
需要 5 分钟阅读时间

编译 CUDA 程序的主要工具是 NVIDIA 提供的闭源编译器 NVCC，但实际上，NVCC 是基于 LLVM 开发的（来源：NVIDIA CUDA Compiler），NVIDIA 也把 NVCC 其中一部分逻辑贡献给了 LLVM 上游，使得 Clang 也可以在 CUDA 的配合下编译 CUDA 程序。这篇博客尝试研究 Clang/LLVM 如何实现 CUDA 程序的编译，主要是 Clang 前端部分，后端部分，也就是从 LLVM IR 到 NVPTX 的这一步还没有进行深入的研究。

2023年10月3日
分类于 os
需要 6 分钟阅读时间

WSL2 内部实现探究

背景

最近看到 Windows Subsystem for Linux September 2023 update 声称 WSL2 最新的预览版本支持让 Linux 和 Windows 一定程度上共享网络地址空间，就像 WSL1 那样：

IPv6 support
Connect to Windows servers from within Linux using the localhost address 127.0.0.1
Connect to WSL directly from your local area network (LAN)
Improved networking compatibility for VPNs
Multicast support

因此比较想知道这是怎么做到的，但目前我手上还没有预览版本的 windows，因此目前先研究 WSL2 已有的功能是如何实现的，未来再回来更新这一部分。

2023年10月1日
分类于 os
需要 9 分钟阅读时间

Linux 内核格式与启动协议

背景

之前在各种场合遇到过各种 Linux 内核的文件名或格式，例如：

vmlinux
vmlinuz
uImage
bzImage
uImage

即使是同样的文件名，格式可能也是不一样的，相应的启动协议也可能不一样。这篇博客尝试结合 Linux，各种 Bootloader（QEMU，EDK-II，U-Boot，OpenSBI）的代码来研究不同的 Linux 二进制格式以及启动协议。

2023年9月25日
分类于 software
需要 2 分钟阅读时间

Podman 和 Docker Rootless 实践

最近在配置公用机器的环境，需求是很多用户需要使用 docker，但是众所周知，有 docker 权限就等于有了 root 权限，因此正好想尝试一下现在的 Rootless 容器化方案，例如 docket rootless 和 podman。

2023年8月11日
分类于 system
需要 2 分钟阅读时间

在 QEMU 中运行 OpenBMC

背景

最近想给某台机器配一个 BMC，于是调研 OpenBMC 发行版，但是还没有找到可以买到的合适的 BMC，因此先在虚拟机中进行尝试。

2023年8月10日
分类于 hardware
需要 8 分钟阅读时间

组装一台采用龙芯 3A6000 CPU 的主机

背景

最近买到了龙芯 3A6000 以及配套主板，在此记录我组装台式机的过程，以及在其上的体验。

2023年8月10日
分类于 hardware
需要 3 分钟阅读时间

LoongArch 处理器

整理市面上的 LoongArch 处理器以及相关产品。

2023年8月6日
分类于 others
需要 1 分钟阅读时间

普通高校招生录取流程

本文是本人对普通高校招生录取流程的整理，可能有误，欢迎指出。文中不涉及一些省份的特殊情况。

2023年8月2日
分类于 software
需要 9 分钟阅读时间

SPEC CPU 2006 性能测试

背景

最近在网上看到龙芯 3A6000 的 SPEC CPU 2006 性能评测数据，想着自己也可以在手上的一些平台上测一测，把测试的过程记录在本文。

2023年8月1日
分类于 others
需要 3 分钟阅读时间

LK-99 相关链接

收录自己找到的一些和 LK-99 相关的信息，非专业人士，看个热闹。

2023年7月31日
分类于 devops
需要 2 分钟阅读时间

记录一次 CentOS AArch64 7 到 8 的升级

背景

有一台 AArch64 机器安装了 CentOS 7，想要升级到 CentOS 8，这篇博客主要讲讲折腾的整个过程，而不是教程：如果真要说，就是不要升级 CentOS 大版本，直接重装吧。如果真的想折腾，可以看看下面的内容。

2023年7月24日
分类于 software
需要 6 分钟阅读时间

VFIO - Virtual Function I/O

背景

VFIO 是 Linux 内核中的一个功能，目的是把 PCIe 设备暴露给用户态的程序，进而可以暴露给虚拟机内的系统，也就是常说的虚拟机 PCIe 直通。为了保证安全性，VFIO 还会配置好 IOMMU，保证用户态程序无法利用设备的 DMA 访问到其他地址空间的数据。

本文探讨 VFIO 暴露的用户态 API 以及如何在用户态中使用 VFIO 直接控制 PCIe 设备。

2023年7月23日
分类于 crypto
需要 8 分钟阅读时间

Montgomery 模乘

背景

在密码学中，经常会涉及到模乘操作：\(a * b \bmod N\)。朴素的实现方法是，先求出 \(a * b\)，再对 N 进行除法，那么余数就是模乘的结果。

但由于此时的 \(a\) \(b\) \(N\) 三个数都很大，在计算机上需要用大整数来表示，而大整数的乘法和除法都是需要耗比较多的时间的。如果用 Schönhage–Strassen 算法，计算两个 \(n\) 位大整数的乘法需要的时间是 \(O(n \log(n) \log(\log(n)))\)。

定义

Montgomery 模乘是一种提高模乘的性能的方法。具体地，Montgomery 模乘需要一个参数 \(R\) 满足 \(R\) 和 \(N\) 互质，且 \(R > N\)，那么 Montgomery 模乘实现的是如下计算：

\[ M(a, b) = a * b * R^{-1} \bmod N \]

2023年7月22日
分类于 programming
需要 2 分钟阅读时间

libc++ 的 uniform_int_distribution 性能问题

背景

前段时间，@lwpie 发现一段 C++ 代码在 macOS 下，分别用自带的 Clang 编译和用 Homebrew 的 GCC 编译，性能差距接近一个数量级，下面是运行时间：

GCC-13 Homebrew: 300
Apple Clang: 2170

2023年7月18日
分类于 programming
需要 2 分钟阅读时间

写一个 bash zsh 和 fish 都能跑的脚本

背景

bash 和 zsh 都实现了 POSIX shell 标准，因此写脚本的时候，比较容易兼容这两种常见的 shell。但现在 fish 也很流行，而 fish 不符合 POSIX shell 标准，很多地方语法多不兼容，能否写一个脚本，可以用 bash，zsh 和 fish 跑？

# The following commands should work
bash test.sh
zsh test.sh
fish test.sh

2023年7月15日
分类于 meta
需要 1 分钟阅读时间

把博客生成器从 Hugo 迁移到 Mkdocs

距离上一次 Jekyll 迁移到 Hugo 已经过去了四年，这次正好 mkdocs-material 发了新的 beta 版本，加入了对博客的支持，所以就当小白鼠，把博客迁移到了 Mkdocs + Mkdocs-Material。

这次迁移比较顺利，除了 tag 和 category 少了一些页面以外，原来的文章的链接都是正常的。为什么要迁移呢，主要是最近写各种文档，Mkdocs 用的比较多，但是 Mkdocs 的 Markdown 很多地方和 Hugo 不太一样，下面列一些最难以忍受的 Hugo 的问题：

数学公式：Hugo 的 \ 需要转义，导致很多地方写数学公式都很麻烦，然后因为我经常要在 Hugo 和 Mkdocs 之间复制 Markdown，此时就需要很多手动工作。
资源路径：Hugo 的资源路径默认都是绝对路径，要引用其他文章的话，要么用啰嗦的 relref，要么就写绝对路径，比较头疼。Mkdocs 就很好，自动检测，帮我计算出实际的地址。

迁移的时候有很多细节上的不同，不过基本靠 VSCode 的正则表达式替换解决了。

不过，Mkdocs 又出现了 Jekyll 的老问题，就是性能比较差。当然了，不一定是 Mkdocs 本身的问题，也可能是 Mkdocs-Material 加各种插件的问题，目前还有待观察。无论如何，Python 调起来总归是比 Ruby 要容易。希望不要在未来的某一天，由从 Mkdocs 迁移回 Hugo。

2023年7月14日
分类于 crypto
需要 2 分钟阅读时间

ECDSA

ECDSA 是一个基于椭圆曲线的签名算法，使用时需要确定一个椭圆曲线，以及它的 base point \(G\)，且 \(G\) 的阶是素数 \(n\)。ECDSA 支持如下的操作：

生成签名
验证签名
从签名和明文推导出公钥

2023年7月8日
分类于 devops
需要 2 分钟阅读时间

在 Apple M1 上试用 Gentoo/Prefix

背景

上一次折腾 Gentoo/Prefix 是五年多以前，当时还是用的 Intel Mac，最近需要探索一下在现在的 macOS 系统上用 Gentoo/Prefix 会遇到哪些问题，因此今天在 Apple M1 上重新尝试一次。

2023年6月20日
分类于 networking
需要 3 分钟阅读时间

生成树协议

本文的内容已经整合到知识库中。

Spanning Tree Protocol

STP（Spanning Tree Protocol）可以在 802.1D-1998 第 8 章中找到。STP 协议工作在交换机上，需要根据交换机连接的拓扑，自动计算出一个生成树，并且把不在生成树上的边禁用，这样即使连接的拓扑有环路，禁用以后就没有环了。有了 STP 以后，连接交换机的时候就可以刻意连成环，从而提供冗余。