博客¶

2026年3月5日
分类于 devops
需要 2 分钟阅读时间

Nginx 反代导致 SSE 延迟变高的问题与解决方法

背景

最近有同学遇到这么一个问题：在 Nginx 反代后面搭了一个使用 SSE（Server Sent Events）机制的服务端，但客户端观察到请求延迟比较高，数据批量到达，而不是一行一行地出现。经过排查，发现是 Nginx 的 buffering 机制导致的。本文通过实验复现该问题，并探索了几种解决方法。

2026年1月21日
分类于 devops
需要 1 分钟阅读时间

记一次软 RAID1 坏盘的恢复过程

背景

最近遇到一个运维场景，两个 SATA 盘组了一个 RAID1，Linux 的根系统也在上面，启动时能进内核，但是内核一直在报错 link is too slow to respond, please be patient 以及 COMRESET failed (errno=-16)。下面记录一下故障排查以及恢复的过程。

2026年1月17日
分类于 hardware
需要 3 分钟阅读时间

IBM POWER9 微架构评测

背景

继 IBM POWER8 之后，也来评测一下后续的 IBM POWER9 微架构。IBM POWER9 有 SMT4 和 SMT8 两种版本，我只有 SMT4 版本的测试环境，下列所有评测都是针对 SMT4 版本进行测试。

2026年1月15日
分类于 hardware
需要 6 分钟阅读时间

IBM POWER8 微架构评测

背景

之前评测了很多 AMD64 和 ARM64 指令集的处理器，这次也来评测一下 PPC64LE 指令集的 IBM POWER8 微架构。

2025年12月25日
分类于 software
需要 3 分钟阅读时间

2025 年我是怎么使用 AI 的

前言

经常看我博客的读者应该能看出来，我研究的主要是计算机系统结构方向，特别是处理器的微架构，几乎没有涉及到 AI 的内容，我也确实不喜欢 AI 研究，仅关注但不参与。但今年，因为各种 AI 技术尤其是 LLM 的发展，我确实成为了很多 AI 技术的用户，可以说 2025 年是我正经大规模用 AI 的元年，所以在年末做一个简单的总结。

2025年10月28日
分类于 hardware
需要 11 分钟阅读时间

条件分支预测器逆向工程（以 Apple M1 Firestorm 为例）

背景

去年我完成了针对 Apple 和 Qualcomm 条件分支预测器（Conditional Branch Predictor）的逆向工程研究，相关论文已发表在 arXiv 上，并公开了源代码。考虑到许多读者对处理器逆向工程感兴趣，但可能因其复杂性而望而却步，本文将以 Apple M1 Firestorm 为例，详细介绍条件分支预测器的逆向工程方法，作为对原论文的补充说明。

2025年10月9日
分类于 software
需要 2 分钟阅读时间

本博客近三个月来的访问数据观察

写在前面

这个博客自 2014 年更新至今，已走过近十一个年头，累计发布了四百多篇文章。出于好奇，我一直想了解哪些内容更受读者欢迎。五年前，我曾配置过 Google Analytics，但使用体验并不理想，于是转而自行部署了 rybbit 实例来收集访问数据。如今三个月过去，是时候与大家分享一些有趣的发现。

P.S. 如果你对数据收集有所顾虑，可以屏蔽对应的 analytics 脚本。

2025年9月10日
分类于 hardware
需要 11 分钟阅读时间

ARM 公版核微架构演进

背景

ARM 公版核微架构的演进频繁，型号又比较多，相关信息散落在各种地方，为了方便查阅，在这里做一个收集。

2025年7月8日
分类于 hardware
需要 7 分钟阅读时间

AMD Zen 3 的 BTB 结构分析

背景

在之前，我们分析了 AMD Zen 1 和 AMD Zen 2 的 BTB，接下来分析它的再下一代微架构：2020 年发布的 AMD Zen 3 的 BTB，看看 AMD 的 Zen 系列的 BTB 是如何演进的。

2025年7月8日
分类于 hardware
需要 6 分钟阅读时间

AMD Zen 2 的 BTB 结构分析

背景

在之前，我们分析了 AMD Zen 1 的 BTB，接下来分析它的下一代微架构：2019 年发布的 AMD Zen 2 的 BTB，看看 AMD 的 Zen 系列的 BTB 是如何演进的。

2025年7月7日
分类于 hardware
需要 6 分钟阅读时间

AMD Zen 1 的 BTB 结构分析

背景

AMD Zen 1 是 AMD 在 2017 年发布的 Zen 系列第一代微架构。在之前，我们分析了 ARM Neoverse N1 和 V1 的 BTB，那么现在也把视线转到 AMD 上，看看 AMD 的 Zen 系列的 BTB 是如何演进的。

2025年6月23日
分类于 hardware
需要 11 分钟阅读时间

ARM Neoverse V1 (代号 Zeus) 的 BTB 结构分析

背景

ARM Neoverse V1 是 ARM Neoverse N1 的下一代服务器 CPU，在 2020 年发布。此前我们分析过 Neoverse N1 的 BTB 设计。而 ARM Neoverse V1 在很多地方都和 Cortex-X1 类似，相比 Neoverse N1/Cortex-A76 有了一些改进，在这里对它的 BTB 做一些分析。

2025年6月10日
分类于 hardware
需要 2 分钟阅读时间

在鸿蒙电脑上的虚拟机内启动 Linux

背景

最近在研究鸿蒙电脑，群友 @Fearyncess 摸索出了，如何在鸿蒙电脑上的虚拟机内启动 Linux，而不是 Windows。在此做个复现并记录。

2025年6月10日
分类于 hardware
需要 7 分钟阅读时间

终端模拟器的文字绘制

背景

最近在造鸿蒙电脑上的终端模拟器 Termony，一开始用 ArkTS 的 Text + Span 空间来绘制终端，后来发现这样性能和可定制性比较差，就选择了自己用 OpenGL 实现，顺带学习了一下终端模拟器的文字绘制是什么样的一个过程。

2025年6月6日
分类于 hardware
需要 6 分钟阅读时间

鸿蒙电脑 MateBook Pro 开箱体验

购买

2025.6.6 号正式开卖，当华为线上商城显示没货的时候，果断去线下门店买了一台回来。购买的是 32GB 内存，1TB SSD 存储，加柔光屏的版本，型号 HAD-W32，原价 9999，国补后 7999。

2025年6月6日
分类于 hardware
需要 2 分钟阅读时间

在 HarmonyOS 5 上运行 Fortran 程序

背景

前段时间把 SPEC CPU 2017 移植到了鸿蒙 5 上：https://github.com/jiegec/SPECCPU2017Harmony，由于 SPEC CPU 2017 里有不少 Fortran 程序，所以就研究了一下怎么编译 Fortran 代码，最终搞成了，在这里记录一下。

2025年6月5日
分类于 hardware
需要 13 分钟阅读时间

ARM Neoverse N1 (代号 Ares) 的 BTB 结构分析

本文同步发布到本人的知乎。

背景

ARM Neoverse N1 是 2019 年发布的比较早的一代 ARM 服务器的处理器，它在很多地方都和 Cortex-A76 类似。它的 BTB 结构比较有意思，所以在这里对它的 BTB 做一些分析。

2025年5月21日
分类于 hardware
需要 23 分钟阅读时间

Apple M4 微架构评测

背景

最近拿到了 Apple M4 的环境，借此机会测试一下 Apple M4 的微架构，和之前分析的 Apple M1 的微架构做比较。由于 Asahi Linux 尚不支持 Apple M4，所以这里的测试都在 macOS 上进行。

2025年5月14日
分类于 hardware
需要 9 分钟阅读时间

Rocket Chip 大量使用了 Diplomacy 系统来组织它的总线、中断和时钟网络。因此，如果想要对 Rocket Chip 进行定制，那么必须要对 Rocket Chip 中 Diplomacy 系统的使用有充分的了解，而这方面的文档比较欠缺。本文是对 Rocket Chip 中 Diplomacy 系统的使用的分析。阅读本文前，建议阅读先前的分析 Diplomacy 系统文章，对 Diplomacy 系统的设计和内部实现获得一定的了解。

2025年4月23日
分类于 hardware
需要 5 分钟阅读时间

Intel Redwood Cove 微架构评测

背景

之前我们测试了 Intel 的微架构 Redwood Cove，这次就来测一下 Redwood Cove，它被用到了 Meteor Lake 以及 Granite Rapids 上。这次就以阿里云 g9i 实例的 Granite Rapids 机器来测试一下 Redwood Cove 微架构的各项指标。

2025年4月10日
分类于 software
需要 11 分钟阅读时间

如何进行条件分支预测器实验

背景

最近针对各种条件分支预测器（Conditional Branch Predictor）做了在各种 benchmark 上的实验，在此记录一下做这个实验的流程。

代码已开源：jiegec/cbp-experiments。

2025年4月7日
分类于 software
需要 16 分钟阅读时间

Thread Local Storage (TLS) 实现探究

背景

TLS 是 thread local storage 的缩写，可以很方便地存储一些 per-thread 的数据，但它内部是怎么实现的呢？本文对 glibc 2.31 版本的 TLS 实现进行探究。

2025年3月30日
分类于 software
需要 31 分钟阅读时间

glibc 内存分配器实现探究

背景

malloc 和 free 日常用的很多，但它内部是怎么实现的呢？本文对 glibc 2.31 版本的内存分配器的实现进行探究。

2025年3月6日
分类于 software
需要 9 分钟阅读时间

Android Runtime 解释器的实现探究

背景

在 V8 Ignition 解释器的内部实现探究中探究了 JavaScript 引擎 V8 的解释器的实现，接下来分析一下 Android Runtime (ART) 的解释器，其原理也是类似的。本博客在 ARM64 Ubuntu 24.04 平台上针对 Android Runtime (ART) 15.0.0 r1 版本进行分析。

2025年3月1日
分类于 software
需要 13 分钟阅读时间

V8 Ignition 解释器的内部实现探究

背景

V8 是一个很常见的 JavaScript 引擎，运行在很多的设备上，因此想探究一下它内部的部分实现。本博客在 ARM64 Ubuntu 24.04 平台上针对 V8 12.8.374.31 版本进行分析。本博客主要分析了 V8 的 Ignition 解释器的解释执行部分。