NingG +

AI 实践:Meta Llama & Llama Index

1.Meta Llama 模型

https://github.com/meta-llama/llama3 中提到 Note of deprecation,是什么含义呢?是废弃了吗?

Llama 没有废弃,但是,拆解为多个子仓库,独立演进了。

Meta(原 Facebook)推出的 LLaMA 系列大语言模型,全称 Large Language Model Meta AI

  1. LLaMA 是 Meta 于 2023 年初发布的开源大语言模型系列。它设计上比 GPT-3/4 更轻量,训练数据和参数更优化,便于学术和产业使用。
  2. 后续 Meta 又发布了 LLaMA 2(2023 年 7 月)和 LLaMA 3(2024 年 4 月),支持多语言,性能在开源模型里属于顶尖水准。
  3. 目前,很多开源衍生模型(如 Vicuna、Mistral、Chinese-LLaMA 等)都是基于 LLaMA 进行二次训练或微调的。

在 GitHub 上 meta-llama/llama3 README 中提到 “(Deprecated) Meta Llama 3” 并配有 “Note of deprecation”,其实这是官方在提示一个仓库层面的整合迁移,并不是说 Llama 3 模型本身被废弃了。

1.1.解读 “Note of deprecation” 的含义

llama3 仓库的 README 和主页面中,可以看到类似这样的说明:

(Deprecated) Meta Llama 3 “Note of deprecation” 提醒开发者:从 Llama 3.1 发布起,GitHub 上的多个仓库已被整合。官方建议迁移至以下仓库:

  • llama-models:核心模型、工具、许可证等
  • PurpleLlama:安全风险与推理时间优化
  • llama-toolchain:训练、推理、微调、安全防护、合成数据生成等工具链
  • llama-agentic-system:用于构建 agent 应用的端到端架构
  • llama-cookbook:社区驱动的脚本与集成示例 (GitHub)

也就是说:“Note of deprecation” 更像是仓库过时的标注,提示你不要再使用该仓库继续开发,而是迁移到上述更加模块化的新结构中。

1.2.总结结构整理如下:

项目内容 是否废弃? 意义与建议
模型(Llama 3 系列) 不是 模型依然活跃,并有后续版本(如 Llama 3.1、3.2、3.3、Llama 4)发布 (维基百科)
llama3 仓库 官方提示不再维护,推荐使用功能更完善、结构更清晰的新仓库 (GitHub)

1.3.进一步背景:模型演进简览

1.4.总结

“Note of deprecation” 并非表示 Llama 模型本身被废弃,而是指该 GitHub 仓库不再推荐使用。

建议你使用以下更现代、更完整的仓库结构来进行开发:

这些替代仓库涵盖了模型加载、推理、安全增强、工具链、示例集成等完整功能,维护更活跃,也更适合当前的开发需求。

如果你需要的话,我可以帮你指导如何在这些新仓库中做快速上手或迁移——你有兴趣的话告诉我即可!

2.Llama Index

LlamaIndex(原名 GPT Index) 本质上是一个 连接 LLM 与外部数据源的框架,核心场景是 RAG(检索增强生成)

2.1.LlamaIndex 功能要点

2.1.1.数据接入(Data Connectors)

意义:让 LLM 可以读取“私有知识库”,而不是只依赖模型本身的训练语料。

2.1.2.数据处理与索引(Data Indexing)

意义:给数据“建档”,方便检索和调用。

2.1.3.检索与查询(Query & Retrieval)

意义:让用户的自然语言问题,能够准确映射到相关的文档片段。

2.1.4.应用构建(Applications & RAG Pipeline)

LlamaIndex 不是只做数据准备,它还提供了 端到端的应用开发工具

意义:不只是“准备数据”,而是帮你直接搭建一个“企业版 ChatGPT + 知识库”。

2.1.5.增强功能(Advanced Features)

2.2.总结

LlamaIndex = 数据接入层 + 索引管理层 + 检索路由层 + 应用构建层

它的定位就是:

3.Meta Llama 和 Llama Index 的差异

llama_index(现在正式名叫 LlamaIndex,之前叫 GPT Index)和 Meta LLaMA 系列模型 其实是完全不同的东西,只是名字里都有 “llama”,容易混淆。

3.1.差异对比

方面 Meta LLaMA (LLaMA 2/3/4) LlamaIndex
定位 大语言模型(LLM)本身,由 Meta 训练和开源 一个 框架/工具库,帮助把 LLM 与外部数据源连接
产出物 预训练语言模型权重(8B、70B、405B 等参数规模) Python 库(pip 安装),不提供模型本身
作用 提供通用的自然语言理解/生成能力 让 LLM 能够访问、组织和查询企业或个人的数据
典型用途 微调成对话助手、agent、代码生成模型等 构建 RAG(Retrieval-Augmented Generation)应用,如 FAQ 助手、文档问答、企业知识库搜索
依赖关系 不依赖 LlamaIndex 可以调用任意 LLM(包括 LLaMA、GPT-4、Claude、Mistral 等)作为推理后端

3.2.举个例子

假设你公司有几百份文档:

所以可以理解为:

3.3.总结

原文地址:https://ningg.top/ai-series-llama-and-llama-index-intro/
微信公众号 ningg, 联系我

同类文章:

微信搜索: 公众号 ningg, 联系我, 交个朋友.

Top