LLL 格基规约算法

LLL（Lenstra–Lenstra–Lovász）格基规约算法实现了格（lattice）的一组基（basis）的规约，规约后得到了新的一组基，并且这些基向量的大小满足不等式。

格

首先定义什么是格（lattice）：

给定 \(\mathbb{R}^n\) 上的 \(n\) 个向量 \(\{b_1, b_2, \cdots b_n\}\)：

\[\begin{align} b_1 &= (a_{11}, a_{12}, \cdots, a_{1n}) \\ b_2 &= (a_{21}, a_{22}, \cdots, a_{2n}) \\ &\vdots \\ b_n &= (a_{n1}, a_{n2}, \cdots, a_{nn}) \\ \end{align}\]

将这些基向量以整系数线性组合得到的空间，就是格：

\[ L = \{\sum_i^d r_ib_i \vert r_i \in \mathbb{Z}\} \]

例如 \(\mathbb{Z}^2\) 就可以认为是以 \((1, 0), (0, 1)\) 为基构成的格，也可以认为是以 \((1, 0), (1, 1)\) 为基构成的格。

格基规约

格规约要实现的事情是，对于给定的格 L，即已知：

\[ L = \{\sum_i^d r_ib_i \vert r_i \in \mathbb{Z}\} \]

计算出一组新的一组基 \(\{b_1', b_2', \cdots, b_n'\}\)，满足：

\[ L = \{\sum_i^d r_ib_i' \vert r_i \in \mathbb{Z}\} \]

也就是两组基在构成格 L 上是等价的。

但是规约的同时，也会给新的一组基添加约束，从而得到“更好”的一组基。

LLL 格基规约算法

LLL 就是一个格基规约算法，对于 \(L \subset \mathbb{Z}^n\) 的一组基，进行规约后得到的基 \(\{b_1, b_2, \cdots b_n\}\) 满足以下的性质：

\[ |b_1| \le 2^{(n-1)/4} |\mathrm{det}(L)|^{1/n} \]

这意味着规约后得到的第一个基的大小是有界的，公式中 \(\mathrm{det}(L)\) 指的是把基向量拼接成的矩形的特征值。

LLL 算法还会得到其他的性质，详见 Wikipedia。

应用

已知整系数多项式的根，求多项式

应用 LLL 可以求解这样一个问题：已知有一个 \(n\) 次整系数多项式以及它的零点 \(r\)，现在要求整系数多项式的各项系数的多少。

例子：已知 \(r=1.6180339\) 是一个 2 次整数多项式 \(ax^2 + bx + c\) 的零点，即 \(ar^2 + br + c=0\)，求 \(a\) \(b\) \(c\)。

为了利用 LLL 格基规约算法，需要根据题目条件构造出一组基 \(\{b_1, b_2, b_3\}\)：

\[\begin{align} b_1 &= (1, 0, Xr^2) \\ b_2 &= (0, 1, Xr) \\ b_3 &= (0, 0, X) \\ \end{align}\]

其中 \(X\) 是一个整数，因为 LLL 算法要求 \(L \subset \mathbb{Z}^n\)，所以上式中的 \(Xr^2\) 和 \(Xr\) 两项都需要取整，这里为了下面公式推导的方便，暂时省略了。

假如对上面的基进行 LLL 格基规约算法，应该会得到一组新的基 \(\{b_1', b_2', b_3'\}\)，满足：

\[ |b_1'| \le 2^{(n-1)/4} |\mathrm{det}(L)|^{1/n} \]

其中：

\[ L = (b_1^T b_2^T b_3^T) = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ Xr^2 & Xr & X \end{pmatrix} \]

计算行列式可得 \(\mathrm{det}(L)=X\)，代入 \(n=3\) 到上式，可得 \(|b_1'| \le 2^{1/2} |X|^{1/3}\)。

又因为两组基是等价的，因此 \(b_1'\) 也可以用 \(\{b_1, b_2, b_3\}\) 线性组合得到，且系数 \(A\) \(B\) \(C\) 是整数：

\[\begin{align} b_1' &= Ab_1 + Bb_2 + Cb_3 \\ &= (A, 0, AXr^2) + (0, B, BXr) + (0, 0, CX) \\ &= (A, 0, XAr^2) + (0, B, XBr) + (0, 0, XC) \\ &= (A, B, X(Ar^2 + Br + C)) \end{align}\]

因此 \(|b_1'| = \sqrt{A^2+B^2+(X(Ar^2+Br+C))^2} \le 2^{1/2} X^{1/3}\)，由于 \(X\) 是自己选定的任意整数，当 X 取足够大时，只有当 \(Ar^2+Br+C \approx 0\) 时，上式才能满足。这样就找到了以 \(r\) 为零点的整系数多项式。

此时 \(A\) 和 \(B\) 可以直接从得到的 \(b_1'\) 基向量中取出，\(C\) 可以通过 \(C=-Ar^2-Br\) 计算得出。

实际上使用 LLL 算法的时候，基的个数可以少于维数，因此对于上面的问题，可以构造出如下一组基：

\[\begin{align} b_1 &= (1, 0, 0, Xr^2) \\ b_2 &= (0, 1, 0, Xr) \\ b_3 &= (0, 0, 1, X) \\ \end{align}\]

此时经过 LLL 规约后得到的 \(b_1'=(A, B, C, *)\)，也就是直接得到了多项式的所有系数。

用 sage 实现上面的算法：

# parameters
r = 1.618
degree = 2
X = 10000

# build lattice matrix
matrix = []

for i in range(degree + 1):
    matrix.append(
        [int(i == j) for j in range(degree + 1)] + [round(X * (r ** (degree - i)))]
    )

# compute first basis vector after LLL reduction
m = Matrix(ZZ, matrix)
ans = m.LLL()[0]

# recover polynomial
expr = 0
x = var("x")
for i in range(degree + 1):
    expr = expr + ans[i] * (x ** (degree - i))

# prints "-x^2 + x + 1"
print(expr)

找到近似给定实数的有理数

使用 LLL 可以针对给定实数 \(a\)，找到整数 \(x\) 和 \(y\)，使得 \(x/y \approx a\)。

为了使用 LLL 算法解决，需要把等式的各项变成整数：

\[\begin{align} \frac{x}{y} &= a \\ x - ay &= 0 \\ 10^px - \mathrm{round}(10^pa)y &= 0 \\ \end{align}\]

乘以 \(10^p\) 后取整是为了在取整之前能够保留 \(a\) 的 \(p\) 位小数部分，也方便后续 LLL 过程中尽量让等式右边等于 0。在此基础上，构造出一组基：

\[\begin{align} b_1 &= (1, 0, 10^p) \\ b_2 &= (0, 1, -\mathrm{round}(10^pa)) \end{align}\]

LLL 规约后得到 \(b_1'=(x, y, 10^px -\mathrm{round}(10^pa)y)\)。

用 Sage 实现：

# parameters
a = 3.1415926535
p = 10

# construct matrix
m = 10**p
matrix = Matrix(
    ZZ,
    [[1, 0, m], [0, 1, round(-a * m)]],
)

# extract answer after LLL
ans = matrix.LLL()
numerator = ans[0][0]
denominator = ans[0][1]

# print "-104348 / -33215 = 3.141592653921421"
print(f"{numerator} / {denominator} = {float(numerator) / denominator}")

更进一步，还可以修改公式，使得在逼近 \(x/y \approx a\) 的同时，还要让 \(y\) 的绝对值尽量小，此时可以这样设计：

\[\begin{align} b_1 &= (1, 0, 10^p, 10^q, 0) \\ b_2 &= (0, 1, -\mathrm{round}(10^pa), 0, 10^q) \end{align}\]

LLL 规约后得到 \(b_1'=(x, y, 10^px -\mathrm{round}(10^pa)y, 10^qx, 10^qy)\)。当 \(p=10, q=5\) 时得到的结果是 \(355 / 113 = 3.1415929203539825\)。

Coppersmith 算法求解同余多项式方程

Coppersmith 算法利用 LLL 算法来求特定情况下在同余意义下的整数多项式的根：

\[ f(x) = 0 \quad \pmod n \]

如果没有同余，例如要解 \(f(x) = 0\)，可以用现成的迭代法来寻找方程的解。但此处多了一个同余，就无法直接用迭代法求解。

因此 Coppersmith 算法的思路是，把未知问题变成已知的问题来求解：存在 \(x_0\) 使得 \(f(x_0)=0 \pmod n\)，如果 \(x_0\) 比较小，\(n\) 比较大，能否找到一个多项式 \(g(x)\) 使得 \(g(x_0)=0\)，并且这个多项式的各项系数比较小，小到在 \(x\) 处于一定范围内时，\(g(x)\) 不会超出 \(n\)，因为此时没有同余，所以可以用迭代法来求解方程。

按照这个思路，Coppersmith 算法分为两步：

找到一个多项式 \(g(x)\)，使得 \(f(x) = 0 \pmod n\) 时 \(g(x) = 0 \pmod n\) 成立，并且这个多项式的各项系数较小
使用迭代法求解 \(g(x) = 0\)（不考虑 \(\bmod n\)），从而得到 \(f(x) = 0 \pmod n\) 的解

核心问题是第一步，怎么找到一个系数更小的 \(g(x)\)？答案是找更高次数的多项式，例如 \(f(x) = x^2+ax+b\)，可以考虑以下的多项式：

\[\begin{align} x^2+ax+b \\ (x^2+ax+b)x \\ (x^x+ax+b)^2 \\ (x^x+ax+b)^2x \\ \end{align}\]

可以看到 \(x_0\) 是上面这些多项式的根。把这些多项式化简，得到了一系列多项式，这些多项式的系数向量构成一组基，可以用 LLL 算法规约：规约后得到的基对应的多项式，就是 \(g(x)\)。用迭代法求解 \(g(x)\)，就可以得到 \(x_0\)。

LLL 格基规约算法

格

格基规约

LLL 格基规约算法

应用

已知整系数多项式的根，求多项式

找到近似给定实数的有理数

Coppersmith 算法求解同余多项式方程

参考文献

评论