格密码分析：正交格攻击

2023-12-12

字数统计: 4.8k字 | 阅读时长≈ 21分

正交格攻击：Orthogonal Lattice Attack （简记为 OL 攻击）是一类重要的格相关攻击。可用于近似公约数问题（Approximate Common Divisor abbr. ACD）、隐藏子集和问题（Hidden Subset Sum Problem abbr. HSSP）等困难问题的求解，在密码分析方向有广泛的应用。

正交格攻击

正交格的本质就是核空间（kernel space），求某个（或者多个）向量 $\mathcal{V}$ 的核空间 $\mathcal{V}^{\perp}$ ，在核空间中进行格规约（LLL 或者 BKZ），从而筛选出具有某种特征的向量组成一个核空间子格的 basis，记为 $\mathcal{V}^{\perp}_s$ ，在新的 $\mathcal{V}^{\perp}_s$ 里面再求核空间回去得到 $(\mathcal{V}^{\perp}_s)^{\perp}$ 的一组基，做 BKZ 或者 LLL 规约，恢复目标向量。

OL 攻击方法可以应用在许多密码分析场景下，下面简单阐述 ACD 和 HSSP 场景下 OL 攻击的应用。

近似公约数问题

近似公约数问题（Approximate Common Divisor Problem），记为 $\mathcal{ACD}(\gamma, \eta, \rho)$ ，定义如下，给定一个 $\eta$ -bit 奇数 $p$ 以及足够多的下面的样例 $a_i$ :

$\left\{a_i=p q_i+r_i: q_i \in \mathbb{Z} \cap\left(0,2^\gamma / p\right), r_i \in \mathbb{Z} \cap\left(-2^\rho, 2^\rho\right)\right\}$

我们想要恢复出 $p$ 。

部分近似公约数问题，记为 $\mathcal{PACD}(\gamma, \eta, \rho)$ ，区别在于此时 $p$ 的某个精确的整数倍是给出的，即额外已知 $a = pq$ 。我们仅考虑 OL 攻击在 $\mathcal{ACD}(\gamma, \eta, \rho)$ 上的应用。以下攻击参考论文 Revisiting Orthogonal Lattice Attacks on Approximate Common Divisor Problems and their Applications。

OL 攻击其一

ACD 问题的第一类 OL 攻击，由 van Dijk, Gentry, Halevi 和 Vaikuntanathan 等人提出。给定一个 $\mathcal{ACD}(\gamma, \eta, \rho)$ 问题，记已知输出样例为 $\vec a = (a_1, \cdots,a_n)$ ，未知的系列参数为 $\vec q = (q_1, \cdots, q_n)$ 和 $\vec r = (r_1, \cdots, r_n)$ ，格 $\mathcal{L}_1(\alpha)$ 是一个 $n \times(n+1)$ 的矩阵，如下

$\left(\begin{array}{cccc} \alpha a_1 & 1 & & \\ \alpha a_2 & & 1 & \\ \vdots & & & \ddots \\ \alpha a_n & & & & 1 \end{array}\right)_{n \times(n+1)}$

其中 $\alpha$ 是一个足够大的数，这样 LLL 或者 BKZ 规约后能够保证短向量的第一维度为 0，即核空间。记 $\vec t = \left(\alpha \sum_{i=1}^n u_i a_i, u_1, \ldots, u_n\right)$ 为规约后的基， $\alpha$ 足够大，因此在规约后的基中的向量 $\vec u$ ，多数（ $n-1$ ）都满足， $\sum_{i=1}^n u_i a_i=0$ 。又 $a_i=p q_i+r_i$ ，也就意味着 $\sum_{i=1}^n u_i r_i=0 \bmod p$ ，因此如果我们再筛选出长度比较短的核向量 $\vec u$ ，使得 $\sum_{i=1}^n u_i r_i \le p$ ，也就意味着 $\sum_{i=1}^n u_i r_i = 0$ 在整数环上也成立，进而得到 $\sum_{i=1}^n u_i q_i = 0$ 。也就是说，此时 $\left(u_1, \ldots, u_n\right)$ 是正交于 $\left(q_1, \ldots, q_n\right)$ 。于是，神奇的事情出现了，我们通过在 $\vec a = (a_1, a_2,a_n)$ 的核空间进行筛选，居然能够得到未知向量 $\vec q$ 和 $\vec r$ 的正交向量，也就是得到了线性关系。

那么，通过筛选出足够多这样的线性关系，我们能否恢复出 $\vec r$ 或者 $\vec q$ 呢？首先注意到。我们寻找的短向量 $\vec u$ 需要满足下面条件：

向量 $\vec u$ 与向量 $\vec a$ 垂直。
向量 $\vec u$ 与向量 $\vec r$ 垂直（足够短即可）。

同时满足上面条件就能满足 $\vec u$ 和 $\vec q$ 垂直，因为 $\vec q, \vec a, \vec r$ 是线性相关的。我们寻找的是与向量组 $\mathcal{V} = (\vec a, \vec r)$ 正交的核空间，也就是说最多能够筛选出 $n-2$ 个线性无关的向量，它们构成了 $\mathcal{V}^{\perp}_s$ 的一组基。在 $\mathcal{V}^{\perp}_s$ 上求核空间回去，能够得到两个向量 $(\mathcal{V}^{\perp}_s)^{\perp} = (\vec x_1, \vec x_2)$ ，容易知道 $\vec r，\vec a$ 在格空间 $\mathcal{L}((\mathcal{V}^{\perp}_s)^{\perp})$ 中，且 $\vec r$ 是一个短向量，LLL 或者 BKZ 能够恢复向量 $\vec r$ ，进一步恢复出参数 $\vec q, p$ 。

Remarks

实际上第一步构造的格 $\mathcal{L}_1(\alpha)$ ，就是在整数环上求 $K = \mathcal{Ker}(\vec a)$ ，维度为 $(n-1) \times n$ ，然后对矩阵 $K$ 做 LLL 或者 BKZ 规约。

OL 攻击其二

第一种 OL 攻击略显复杂，不够直接，因为我们寻找的是 $(\vec a, \vec r)$ , 也就是 $(\vec a, \vec q)$ 的核空间，那么利用 $\vec a$ 的结构，能否直接求 $\vec q$ 的核空间呢？

基于上述考虑，van Dijk, Gen- try, Halevi 和 Vaikuntanathan 等人提出了第二种 OL 攻击。给定一个 $\mathcal{ACD}(\gamma, \eta, \rho)$ 问题，记已知输出样例为 $\vec a = (a_1, \cdots,a_n)$ ，未知的系列参数为 $\vec q = (q_1, \cdots, q_n)$ 和 $\vec r = (r_1, \cdots, r_n)$ ，格 $\mathcal{L}_2(\rho)$ 是一个 $n \times(n+1)$ 的矩阵，如下

$\mathcal{L}_2(\rho) = \left(\begin{array}{cccc} a_1 & 2^\rho & & \\ a_2 & & 2^\rho & & \\ \vdots & & & \ddots & \\ a_n & & & & 2^\rho \end{array}\right)_{n \times(n+1)}$

上述格的核心思想就是搜索向量 $\vec t = \left(\sum_{i=1}^n u_i a_i, u_1 2^\rho, \ldots, u_n 2^\rho\right)$ ，使得它垂直于 $\left(1,-\frac{r_1}{2^\rho}, \ldots,-\frac{r_n}{2^\rho}\right)$ ，即有 $\sum_{i=1}^n u_i a_i=\sum_{i=1}^n u_i r_i$ ，从而 $\sum_{i=1}^n u_i q_i=0$ 。

格 $\mathcal{L}_2(\rho)$ 能找到正交于 $\vec q$ 向量是因为 $a_i = p q_i + r_i$ ，如果规约得到短向量，意味着 $\vec u = (u_1,\cdots,u_n)$ 本身会很短（决定 $\vec t$ 后 $n$ 维），从而第一维度不可能含有 $p$ 的项，也就要求 $\sum_{i=1}^n u_i q_i=0$ 。否则假设 $k = \sum_{i=1}^n u_i q_i \ne 0$ ，第一维度为 $k p + \sum u_i r_i$ ，因为 $u_i, r_i$ 都远远小于 $p$ ，从而第一维远远大于其他维度的值，这是不太可能的。

至于 $\mathcal{L}_2(\rho)$ 里的 $2^\rho$ ，是为了使得我们的目标向量更加平衡，质量更好，更容易规约得到目标解。

一般来说，对 $\mathcal{L}_2(\rho)$ 进行 LLL 规约，得到一组 basis ，我们能够从这组 basis 中取到 $n-1$ 组线性无关的短向量 $\vec u$ 组成 $\mathcal{V}^{\perp}_s$ ，它们是正交于向量 $\vec q$ 的完整核空间。对这 $n-1$ 组向量再求核空间，得到的 $(\mathcal{V}^{\perp}_s)^{\perp}$ 恰好只有一组向量，即 $\vec q$ ，这里有一个前提要求是 $q_1,\cdots, q_n$ 的最大公约数为 1，这在 $n$ 比较大，随机生成的情况下是大概率满足的，否则我们得到的是 $\frac{\vec q}{\mathcal{GCD}(\vec q)}$ 。

OL 攻击其三

针对 $\mathcal{ACD}(\gamma, \eta, \rho)$ 第三类 OL 攻击和第二类 OL 攻击的核心思路是一样的。记已知输出样例为 $\vec a = (a_1, \cdots,a_n)$ ，未知的系列参数为 $\vec q = (q_1, \cdots, q_n)$ 和 $\vec r = (r_1, \cdots, r_n)$ ，格 $\mathcal{L}_3$ 是一个 $n \times n$ 的矩阵，如下

$\mathcal{L}_3 = \left(\begin{array}{cccc} 1 & & & a_1 \\ & \ddots & & \vdots \\ & & 1 & a_{n-1} \\ & & & a_n \end{array}\right)_{n \times n}$

此时我们规约得到的目标向量为 $\vec t =\left(u_1, \ldots, u_{n-1}, \sum_{i=1}^n u_i a_i\right)$ ，我们想要向量 $\vec t$ 正交于 $\left(-r_1, \ldots,-r_n, 1\right)$ ，因为这意味着 $\sum_{i=1}^n u_i a_i=\sum_{i=1}^n u_i r_i$ ，将 $a_i = p q_i + r_i$ 代入，得到 $\sum_{i=1}^n u_i q_i=0$ ，即 $\vec u$ 是正交于 $\vec q$ 的向量。

我们简单分析格 $\mathcal{L}_3$ 为什么能够找到上述短向量， $\mathcal{L}_3$ 最后一个行向量里的 $a_n$ 本质是作为模数的作用，而由于 $a_i = p q_i + r_i$ ，并且 $r_i$ 远远小于 $p$ 和 $q_i$ ，上面的格本质可以换成：

$\mathcal{L}_3^\prime = \left(\begin{array}{cccc} 1 & & & r_1 \\ & \ddots & & \vdots \\ & & 1 & r_{n-1} \\ & & & r_n \end{array}\right)_{n \times n}$

在 $\vec r$ 足够小的情况下下，目标向量 $\vec t =\left(u_1, \ldots, u_{n-1}, \sum_{i=1}^n u_i a_i\right)$ 大概率可以视为 $\vec t^\prime =\left(u_1, \ldots, u_{n-1}, \sum_{i=1}^n u_i r_i\right)$ 。后续求解向量 $\vec q$ 和第二类 OL 攻击类似。

OL 的优化

针对第三类 OL 攻击的 $\mathcal{PACD}$ 的优化，额外给出 $a_0 = pq_0$ ，可以定义如下格（参考论文 Fully Homomorphic Encryption over the Integers with Shorter Public Keys 6.2 节，原论文这里应该是有 typo）

$L=\left[\begin{array}{ccccc} 1 & & & & \left[\frac{-a_1}{a_n}\right]_{a_0} \\ & 1 & & & \left[\frac{-a_2}{a_n}\right]_{a_0} \\ & & \ddots & & \vdots \\ & & & 1 & \left[\frac{-a_{n-1}}{a_n}\right]_{a_0} \\ & & & & a_0 \end{array}\right]$

其中 $[\cdot]_{a_0}$ 表示取模运算。

第一类 OL 攻击的格在论文 Revisiting Orthogonal Lattice Attacks on Approximate Common Divisor Problems and their Applications 3.3 节中提到的优化为：

$\left(\begin{array}{cccc} \lfloor\frac{a_1}{\alpha}\rfloor & 1 & & \\ \lfloor\frac{a_2}{\alpha}\rfloor & & 1 & \\ \vdots & & & \ddots \\ \lfloor\frac{a_n}{\alpha}\rfloor & & & & 1 \end{array}\right)_{n \times(n+1)}$

隐藏子集和问题

Nguyen 和 Stern 在 1999 年美密会上提出了隐藏子集和问题（Hidden Subset Sum Problem），可以用于一些密码算法的分析，并且提出了 Nguyen-Stern 算法，求解 HSSP，并且后续破解了一系列签名、加密算法，。

定义 $\mathcal{HSSP}$ ：令 $M$ 是一个整数， $\alpha_1, \alpha_2,\cdots, \alpha_n$ 为 $\mathbb{Z}_m$ 上的随机整数， $\rm \bf x_1, x_2, \cdots, x_n\in \mathbb{F_2}^m$ 是 m-维随机向量。 $\rm \bf h$ 满足：

$\mathbf{h} = \alpha_1 \mathbf{x_1} + \alpha_2 \mathbf{x_2} + \cdots \alpha_n \mathbf{x_n} \mod M$

给出 $M,\rm\bf h$ ，恢复出隐藏数集 ${\rm\bf \alpha} = \alpha_1, \alpha_2,\cdots, \alpha_n$ 和对应的向量 $\rm\bf x_i$ 。

值得注意的是，对于每个 $h_i$ ，都对应一个大小为 $n$ 的子集和问题。因此上面的向量给出了 $m$ 个在相同数集 ${\rm\bf \alpha} = \alpha_1, \alpha_2,\cdots, \alpha_n$ 上的子集和问题，但是数集 $\rm\bf \alpha$ 也是未知的，因此称为隐藏子集和问题。

HSSP 的 OL 攻击

Nguyen-Stern 算法使用了正交格的思想求解 HSSP 问题。我们考虑在 $\mathbb{Z}_M$ 上正交于向量 $\mathbf{h}$ 的核空间，假设 $\mathbf{u}$ 与 $\mathbf{h}$ 正交，即：

$\langle\mathbf{u}, \mathbf{h}\rangle \equiv \alpha_1\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{1}}\right\rangle+\cdots+\alpha_n\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{n}}\right\rangle \equiv 0 \quad(\bmod M)$

这也就意味着 $\mathbf{p}_{\mathbf{u}}=\left(\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{1}}\right\rangle, \ldots,\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{n}}\right\rangle\right)$ 和向量 $\boldsymbol{\alpha}=\left(\alpha_1, \ldots, \alpha_n\right)$ 在模 $M$ 意义上垂直。我们寻找足够短的向量 $\mathbf{u}$ ，由于 $\rm \bf x_1, x_2, \cdots, x_n\in \mathbb{F_2}^m$ ，这就会导致 $\mathbf{p}_{\mathbf{u}}$ 很短。我们知道在模 $M$ 意义下与 $\boldsymbol{\alpha}=$ $\left(\alpha_1, \ldots, \alpha_n\right)$ 正交的核空间中，存在最短的向量，记这个核空间中的最短向量模长为 $\gamma$ 。此时如果 $\mathbf{u}$ 向量很短，模长远远小于 $\gamma$ ，从而 $\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{i}}\right\rangle$ 也远远小于 $\gamma$ ，即 $\mathbf{p}_{\mathbf{u}}=\left(\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{1}}\right\rangle, \ldots,\left\langle\mathbf{u}, \mathbf{x}_{\mathbf{n}}\right\rangle\right)$ 的模长小于 $\gamma$ 并且和 $\boldsymbol{\alpha}$ 正交，那么只能满足 $\mathbf{p}_{\mathbf{u}}= \mathbf{0}$ 。因此，我们得到的 $\mathbf{u}$ 会在整数环上正交于所有的 $\rm \bf x_1, x_2, \cdots, x_n$ 向量 。

在 $\mathbb{Z}_M$ 上求向量 $\rm\bf h$ 的核空间的格如下（其中 $\beta$ 选取得足够大）

$\mathcal{L(\mathbb{h}^\perp)} = \left(\begin{array}{cccc} \beta h_1 & 1 & & \\ \beta h_2 & & 1 & \\ \vdots & & & \ddots \\ \beta h_n & & & & 1 \\ \beta M \end{array}\right)_{(n+1) \times(n+1)}$

假设能够上面的格中得到 $t \le m-n$ 个足够小的向量 $\mathbf{u}$ 使得 $V^{\perp} =\{\mathbf{u} | \left\langle\mathbf{u}, \mathbf{x}_{\mathbf{i}}\right\rangle = 0, i\in [1,n]\}$ ，再对 $V^{\perp}$ 求核空间，得到 $(V^{\perp})^\perp$ 的一组 basis ，对这组 basis 做 LLL 或者 BKZ 规约，就能恢复出所有的 $\rm\bf x_i$ 向量，从而也能恢复出 ${\rm\bf \alpha} = (\alpha_1, \alpha_2,\cdots, \alpha_n)$ 。

Nguyen-Stern 算法

本节给出标准的 Nguyen-Stern 算法。记：

$\mathcal{L}_0:=\Lambda_M^{\perp}(\mathbf{h})=\left\{\mathbf{u} \in \mathbb{Z}^m \mid\langle\mathbf{u}, \mathbf{h}\rangle \equiv 0 \quad(\bmod M)\right\} \\ \mathcal{L}_{\mathbf{x}} = \mathcal{L}(\rm\bf x_1,x_2,\cdots, x_n)$

一个简单算法流程如下：

首先在 $\mathbb{Z}_M$ 计算 $\mathcal{L}_0$ 的一组 LLL-reduced 基。
在这组基中选取最短的 $m-n$ 组向量 $\mathbf{u}_1, \ldots, \mathbf{u}_{m-n}$ ，这组基将恰好是 $\mathcal{L}_{\mathrm{x}}^{\perp}$ 的一组生成基。
在整数环上计算 $\mathcal{L}_{\mathrm{x}}^{\perp}$ 的核空间， $\bar{\mathcal{L}}_{\mathrm{x}}=\left(\mathcal{L}_{\mathrm{x}}^{\perp}\right)^{\perp}$ 。 $\bar{\mathcal{L}}_{\mathrm{x}}$ ，计算 $\bar{\mathcal{L}}_{\mathrm{x}}$ 的一组基 $\rm\bf c_1,c_2,\cdots,c_n$ 。
对这组基 $\rm\bf c_1,c_2,\cdots,c_n$ 计算 BKZ-reduced 基，筛选这些基，直至满足所有基向量都是二元的，即恢复了 $\rm\bf x_1,x_2,\cdots,x_n$ 向量。

下图是 Nguyen-Stern 算法中 OL 攻击的部分（即上面的 step1-3，图源自论文 A Polynomial-Time Algorithm for Solving the Hidden Subset Sum Problem）：

Optimized Nguyen-Stern 算法

Jean-S´ebastien Coron 和 Agnese Gini 在论文 A Polynomial-Time Algorithm for Solving the Hidden Subset Sum Problem 给出了 HSSP 的优化解法。其优化步骤与 OL 攻击无关，而在于最后一步如何恢复 $\rm\bf x_1,x_2,\cdots,x_n$ 。

Nguyen-Stern 算法恢复 $\rm\bf x_1,x_2,\cdots,x_n$ 向量并不是简单的。因为 $\mathbb{x_i}$ 不是其中最短的向量，而是它们的线性组合，比如 $\rm\bf {x}_i - {x_j}$ 就可能比 $x_i$ 短。规约得到的向量里的元素会大概率落在 $\{0,1,-1\}$ 中，而我们的目标向量 $\rm\bf x_i$ 向量里的元素只会落在 $\{0,1\}$ 中。因此 Nguyen-Stern 算法提出将格 $\mathcal{L}_{\mathrm{x}}$ 转换成 $\mathcal{L}_{\mathrm{x}}^{\prime}=2 \mathcal{L}_{\mathrm{x}}+\mathbf{e} \mathbb{Z}$ ，其中 $\mathbf{e}=(1, \ldots, 1)$ ，这意味着元素落入 $\{0,1,-1\}$ 的向量 $\mathbf{v} \in \mathcal{L}_{\mathrm{x}}$ ，它在新的格里面对应的短向量是 $2 \mathbf{v} \in \mathcal{L}_{\mathbf{x}}^{\prime}$ （加减若干个 $\mathbf{e}$ 不能减少模长），其元素落入 $\{0,-2,2\}$ 中，而元素只落入 $\{0,1\}$ 中的向量 $\mathbf{v} \in \mathcal{L}_{\mathrm{x}}$ ，它在新的格里面对应的短向量 $2 \mathbf{x}-\mathbf{e} \in \mathcal{L}_{\mathbf{x}}^{\prime}$ ，其元素会落入 $\{-1,1\}$ 中，有很大概率比前面的向量要短。因此，在新的格 $\mathcal{L}_{\mathrm{x}}^{\prime}$ 中，我们能够恢复出原始的 $\rm\bf x_1,x_2,\cdots,x_n$ 向量，而不是它的线性组合。

Jean-S´ebastien Coron 和 Agnese Gini 对 Nguyen-Stern 算法最后 BKZ 规约以恢复 $\rm\bf x_1,x_2,\cdots,x_n$ 向量的部分进行了修改，即使用线性化、多变元的思想解方程恢复目标向量 $\rm\bf x_1,x_2,\cdots,x_n$ 。在 Nguyen-Stern 算法中，我们只需要大概 $m = 2n$ 个隐藏子集和样例即可求解，但是优化后的算法至少需要 $m = n^2/2$ 个隐藏子集和样例才能解多变元方程。

因此一个现实的问题是，我们不能用算法一直接求 LLL 得到 $\bar{\mathcal{L}}_{\mathrm{x}}$ ，在 $n = 200$ 时， $m =20000$ ，此时维度太大，LLL 的性能极差。甚至在 $M$ 不是素数，难以分解的时候，核空间的求解都是比较困难的。于是 Jean-S´ebastien Coron 和 Agnese Gini 提出了一个比较巧妙的办法去求解这种非常高维度场景下的 $\bar{\mathcal{L}}_{\mathrm{x}}$ ，每次只对大小为 $2n$ 的格进行 LLL-reduce ，得到完整的 basis 在对应维度上的投影，然后选定前 $n$ 个维度（固定住），把其他各个维度都进行简单转换计算，这样就能以比较简单的方式将多次计算的结果进行合并，得到最后的 $\bar{\mathcal{L}}_{\mathrm{x}}$ 。一个概念性的计算流程图如下：

假设 $m = (d+1)n$ ， $\mathbf{h}=\left[\mathbf{h}_0, \ldots, \mathbf{h}_d\right]$ ，其中 $\mathbf{h_i} \in \mathbb{Z}^n$ 。每次都使用算法 1 对 $\left(\mathbf{h}_0, \mathbf{h}_i\right) \in \mathbb{Z}^{2 n}$ 这个子向量进行计算 $\bar{\mathcal{L}}_{\mathrm{x}}$ 在对应维度的投影，得到 $\mathbf{C}_0^{(i)} \| \mathbf{C}_i \in \mathbb{Z}^{n \times 2 n}$ ，但是我们保证每次前 $n$ 个维度都固定投影为 $\mathbf{C}_0 = \mathbf{C}_0^{(1)}$ ，后续就可以将 $\bar{\mathcal{L}}_{\mathrm{x}}$ 的 basis 在各个维度的投影组合起来了。将算法 1 的作用表示为一个函数，记为 $\textsf{OrthoLat}$ 。则针对 $m \gg n$ 情况下的正交格攻击算法如下：

后续第二步的攻击算法与 OL 攻击无关，由于 $\rm\bf x_i$ 都是二元的，即全部元素都落入 $\{1,0\}$ 中，则有 $\rm\bf x^2 - 1 = 0$ 。然后转换为多变元二次方程组的求解，注意到一般的多变元二次方程组的求解是 NP 困难的，但是利用线性化的思想就能转换为线性方程组求解，因此是简单的，Jean-S´ebastien Coron 和 Agnese Gini 工作的最大贡献就是把 Nguyen-Stern 算法第二步原本指数级别复杂度的 BKZ 算法替换成了多项式时间内可解的问题。感兴趣的读者可以阅读原论文 A Polynomial-Time Algorithm for Solving the Hidden Subset Sum Problem 第 4.2 节。

OL 攻击总结

OL 攻击应用的基本思路是在已知向量的核空间去筛选足够短的向量，从而得到一些未知向量的核空间，筛选出这些未知向量的核空间的 basis ，就能再求一次正交，进而得到包含未知向量的格空间的 basis ，进而恢复未知向量。

OL 攻击中一个关键的步骤就是求核空间（kernel space），对于任意 $t$ 个向量 $\rm\bf V = v_1, \cdots,v_t \in \mathbb{Z}^n$ 。

在整环 $\mathbb{Z}$ 上 $\rm\bf V$ 的核空间 LLL-reduced 基可以由下面的格得到（ $\beta$ 足够大）：

$\mathcal{L}(\mathbf{V}^\perp) = \begin{bmatrix} \rm\bf \beta v_{1}^{(1)} & \rm\bf \beta v_{2}^{(1)} & \cdots & \rm\bf \beta v_{t}^{(1)} & 1 \\ \rm\bf \beta v_{1}^{(2)} & \rm\bf \beta v_{2}^{(2)} & \cdots & \rm\bf \beta v_{t}^{(2)} & & 1\\ \vdots & \vdots & \vdots & \vdots & & & \ddots \\ \rm\bf \beta v_{1}^{(n)} & \rm\bf \beta v_{2}^{(n)} & \cdots & \rm\bf \beta v_{t}^{(n)} & & & & 1\\ \end{bmatrix}_{n \times (t+n)}$

在模环 $\mathbb{Z}_q$ 上 $\rm\bf V$ 的核空间的 LLL-reduced 基可以由下面的格得到（ $\beta$ 足够大）：

$\mathcal{L}_q(\mathbf{V}^\perp) = \begin{bmatrix} \rm\bf \beta v_{1}^{(1)} & \rm\bf \beta v_{2}^{(1)} & \cdots & \rm\bf \beta v_{t}^{(1)} & 1 \\ \rm\bf \beta v_{1}^{(2)} & \rm\bf \beta v_{2}^{(2)} & \cdots & \rm\bf \beta v_{t}^{(2)} & & 1\\ \vdots & \vdots & \vdots & \vdots & & & \ddots \\ \rm\bf \beta v_{1}^{(n)} & \rm\bf \beta v_{2}^{(n)} & \cdots & \rm\bf \beta v_{t}^{(n)} & & & & 1\\ \beta q \\ & \beta q \\ & & \ddots \\ & & & \beta q \end{bmatrix}_{(n + t) \times (n+t)}$

一些参考

一些用到了 OL 攻击技巧的 CTF 赛题：

Zer0pts CTF 2022 Karen : HSSP 求解。
D3CTF 2023 d3pack : AHSSP 求解。
HITCON CTF 2022 Chimera : HSSP 问题的变体。

一些 OL 攻击的论文推荐：

Revisiting Orthogonal Lattice Attacks on Approximate Common Divisor Problems and their Applications ： OL 攻击综述性质的论文。
A Polynomial-Time Algorithm for Solving the Hidden Subset Sum Problem : HSSP, AHSSP 求解算法， OL 攻击的应用。
Lattice Attacks on the DGHV Homomorphic Encryption Scheme : ACD, PACD 问题的求解，OL 攻击的应用。