AI 实践：ANN 近似最近邻检索

2025-08-16

疑问：向量检索（embedding + ANN） , 其中的 ANN 是什么？

这个 ANN 不是人工神经网络 (Artificial Neural Network)，而是：

1. 为什么需要 ANN？

在向量检索里，每个文档片段都被编码成一个高维向量（embedding）。

但问题是：

所以，引入 ANN：它放弃”完全精确”，转而使用高效的数据结构和算法来快速找到近似的、但几乎一样好的最近邻。

几类主流方法：

树结构 (Tree-based)
- KD-Tree, Ball Tree 等
- 适合低维数据，高维失效（curse of dimensionality）
哈希 (Hash-based)
- LSH (Locality-Sensitive Hashing)
- 把相似向量映射到相同桶里，加速查找
图结构 (Graph-based)
- HNSW (Hierarchical Navigable Small World)
- 建立”向量之间的邻居图”，查询时像爬图一样跳跃搜索
- 目前是业界主流（比如 Milvus、Faiss、Weaviate 都支持）
量化 (Quantization-based)
- PQ (Product Quantization)、IVF-PQ 等
- 用压缩技术减少存储，并在粗粒度的索引上缩小候选范围

ANN 就是”为了在海量向量库里快速找到近似的最近邻”的算法集合，是向量检索的核心基础设施。

在 LLM（大语言模型） 相关的 向量检索 / ANN（Approximate Nearest Neighbor, 近似最近邻） 场景里，你提到的 HNSW 是一种非常常用的索引结构，含义是：

HNSW = Hierarchical Navigable Small World graph

中文可理解为 “分层可导航小世界图”。

小世界图（Small World Graph） 小世界网络的特性是：绝大部分点之间的最短路径非常短（通常是对数级别）。这让在高维空间里找到近似邻居变得高效。
分层（Hierarchical） HNSW 在多层图结构上组织数据：
- 顶层是稀疏图，点少，能快速缩小范围。
- 越往下层，点越多，图越密，能更精细地找到最近邻。
- 检索时先在顶层找到一个较近的入口点，再逐层下降，直到最底层找到近似最近邻。
可导航（Navigable） 图的边设计成可以高效“导航”，从任意入口都能较快走向目标区域。

在 LLM 的 RAG（检索增强生成） 或 embedding 检索 里，通常要从 百万 / 亿级别 的向量库里找到最相关的上下文。

常见向量数据库（如 FAISS、Milvus、Weaviate、Pinecone 等）几乎都实现了 HNSW。

原文地址：https://ningg.top/ai-series-ann-intro/

点击:联系我

微信公众号 ningg, 联系我