RAG 教程笔记（Task01）

2025-12-15

3.29k 字 | 11 分钟

1. RAG 简介

1.1 RAG 定义

RAG：检索增强生成 的缩写。它是一种将 信息检索 与 大语言模型 相结合的人工智能框架。简单来说，它的工作原理是：「先查找，再回答」。

当用户提出一个问题时，RAG 系统不会直接让 LLM 凭空生成答案，而是会先从外部的知识库（如文档、数据库、网页）中检索出与问题最相关的信息片段，然后将这些信息片段和原始问题一起「喂」给 LLM，让 LLM 基于这些 最新、最准确、最具体 的上下文信息来生成最终答案。

RAG 就像给一个博学但记忆有延迟的学者（LLM）配了一个超级图书馆员和一台实时资料检索机。每当学者需要回答问题时，图书馆员立刻从海量、最新的书库中找出最相关的几页资料递给他，学者再基于这些资料给出精准可靠的回答。

1.2 RAG 的工作原理

一个典型的 RAG 系统工作流程如下：

第一步：知识库构建（预处理，离线进行）

文档加载：收集所有相关的文档（PDF、Word、网页、数据库等）。
切分：将长文档分割成更小的、有意义的「块」。
向量化：使用嵌入模型将每个文本块转换为一个高维数值向量（称为「嵌入」）。这个向量代表了文本的语义。
存储：将这些向量及其对应的原始文本存储到向量数据库中。

第二步：检索与生成（在线响应用户查询）

检索：当用户提出问题时，系统使用相同的嵌入模型将问题也转换为一个向量。然后，在向量数据库中搜索与这个问题向量最相似的文本块向量（通常使用余弦相似度）。这些被找到的文本块就是最相关的上下文。
增强：系统将用户的原始问题和检索到的相关文本片段组合成一个结构化的「提示」，交给 LLM。提示通常类似于：

「请基于以下上下文信息回答问题。如果上下文信息不足以回答问题，请直接说‘根据提供的信息，我无法回答这个问题’。
上下文：
[这里插入检索到的相关文本片段1]
[这里插入检索到的相关文本片段2]
问题： [用户的问题]
答案：」
生成：LLM 接收到这个富含相关上下文的提示后，生成一个准确、有据可依的答案。系统通常还会要求 LLM 在答案中注明引用的来源。

1.3 为什么需要 RAG

大语言模型虽然强大，但存在几个关键局限，RAG 正是为了解决这些问题而生的：

知识过时 / 静态：LLM 的训练数据有截止日期（例如，GPT-4 的知识截止到 2023年4月）。它无法知道这之后发生的事件或最新的信息。
缺乏领域 / 专有知识：LLM 对通用知识掌握得很好，但对于企业内部文档、特定领域的非公开资料、个人笔记等「私有知识」一无所知。
容易「幻觉」：当 LLM 遇到其训练数据中不明确或不存在的信息时，它可能会自信地编造一个看似合理但错误的答案。
无法溯源：LLM 的答案是一个「黑箱」，你无法知道它的回答是基于哪些具体信息源得出的，难以验证其可信度。

1.3.1 RAG 的主要优势

答案准确性高：基于最新、最相关的具体信息生成，大幅减少「幻觉」。
知识可更新：只需更新向量数据库中的文档，即可让系统获得新知识，无需重新训练昂贵的 LLM。
成本效益：比为了获取新知识而重新训练或微调一个 LLM 要便宜和快速得多。
可溯源与可信：答案可以追溯到具体的源文档，提高了透明度和可信度。
易于实现：有成熟的工具链（如 LangChain、LlamaIndex）和向量数据库（如 Pinecone、Chroma、Weaviate）支持。

1.3.2 RAG 的典型应用场景

智能客服/问答系统：基于产品手册、FAQ文档回答用户问题。
企业知识库助手：员工可以快速查询公司内部的规章制度、项目报告、会议纪要等。
学术研究助手：基于大量的论文库回答专业问题。
法律、医疗等专业领域顾问：基于法律法规、病例数据库提供信息参考。
任何需要基于特定、最新文档进行问答的场景。

1.3.3 与微调的区别

RAG：侧重于为 LLM 提供外部知识。LLM 本身的能力（如逻辑、文风）不变，但获得了回答问题所需的具体材料。适合知识密集型任务。
微调：通过额外的数据训练，改变 LLM 本身的权重参数，使其适应特定任务、风格或领域。适合改变模型行为或风格。

在选择技术路径时，经常是先尝试提示工程，再选择 RAG，最后才考虑微调。

1.4 RAG 系统的评估

一套 RAG 系统的好坏，可以从 检索质量（评估检索器是否找到了包含答案所需信息的文档片段）、生成质量（在检索到相关上下文的基础上，评估 LLM 生成答案的质量）。

2. 简易 RAG 实现

import os
# hugging face镜像设置，如果国内环境无法使用启用该设置
# os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
from dotenv import load_dotenv
from langchain_community.document_loaders import UnstructuredMarkdownLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_core.vectorstores import InMemoryVectorStore
from langchain_core.prompts import ChatPromptTemplate
from langchain_deepseek import ChatDeepSeek

load_dotenv()

markdown_path = "../../data/C1/markdown/easy-rl-chapter1.md"

# 加载本地markdown文件
loader = UnstructuredMarkdownLoader(markdown_path)
docs = loader.load()

# 文本分块
text_splitter = RecursiveCharacterTextSplitter()
chunks = text_splitter.split_documents(docs)

# 中文嵌入模型
embeddings = HuggingFaceEmbeddings(
    model_name="BAAI/bge-small-zh-v1.5",
    model_kwargs={'device': 'cpu'},
    encode_kwargs={'normalize_embeddings': True}
)

# 构建向量存储
vectorstore = InMemoryVectorStore(embeddings)
vectorstore.add_documents(chunks)

# 提示词模板
prompt = ChatPromptTemplate.from_template("""请根据下面提供的上下文信息来回答问题。
请确保你的回答完全基于这些上下文。
如果上下文中没有足够的信息来回答问题，请直接告知：“抱歉，我无法根据提供的上下文找到相关信息来回答此问题。”

上下文:
{context}

问题: {question}

回答:"""
                                          )

# 配置大语言模型
llm = ChatDeepSeek(
    model="deepseek-chat",
    temperature=0.7,
    max_tokens=4096,
    api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxx"
)

# 用户查询
question = "文中举了哪些例子？"

# 在向量存储中查询相关文档
retrieved_docs = vectorstore.similarity_search(question, k=3)
docs_content = "\n\n".join(doc.page_content for doc in retrieved_docs)

answer = llm.invoke(prompt.format(question=question, context=docs_content))
print(answer)

参考资料

All-in-RAG | 大模型应用开发实战一：RAG技术全栈指南

赏

本文作者： 程序员充电站
本文链接： https://itcharge.cn/tech/llm-dev/rag-tutorial/
版权声明： 本站所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。

RAG 教程笔记（Task01）

1. RAG 简介

1.1 RAG 定义

1.2 RAG 的工作原理

1.3 为什么需要 RAG

1.3.1 RAG 的主要优势

1.3.2 RAG 的典型应用场景

1.3.3 与微调的区别

1.4 RAG 系统的评估

2. 简易 RAG 实现

参考资料

评论（没有评论）

程序员充电站

最新文章

联系方式

目录

1. RAG 简介

1.1 RAG 定义

1.2 RAG 的工作原理

1.3 为什么需要 RAG

1.3.1 RAG 的主要优势

1.3.2 RAG 的典型应用场景

1.3.3 与微调的区别

1.4 RAG 系统的评估

2. 简易 RAG 实现

参考资料

最新文章

热门标签

联系方式

目 录

目录