CtrlK

社群论坛拆分

创作

AI笔记-大模型应用-RAG

参考资料

说明说明

最近用 langchain 搭了一个简易的RAG系统自动处理了一些工作的应用，顺便学了些原理。我把具体工作内容删了（例子），只留下原理部分分享出来（其实就是把论文里的内容复制粘贴一遍）。

链接参考资料

RAG

Embedding

一些RAG应用：

RAG原理

大模型局限

阅读gpt3论文 https://arxiv.org/pdf/2005.14165 可知，大模型内部参数是固定的，不会实时更新；而且有“幻觉”现象，产出的内容不可全信。

RAG相关论文 https://arxiv.org/pdf/2507.18910 也提到: Traditional LLM-based generation relies solely on the model’s internal parameters for knowledge, which can lead to hallucinations and factual inaccuracies when the model’s training data does not adequately cover the query’s topic

RAG原因

针对大模型“无法实时更新模型”这个局限性，RAG技术应运而生。

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/z94jtly0e7ejl6c8jt1qhjr1.png)

RAG优点

1\. 提升模型回答的准确性，减轻幻觉现象

2\. 能够在不用重新训练模型的情况下回答实时的知识

3\. 向量检索速度快

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/dfx4ly1mm57lnul8flz7xkrp.png)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/qjgxqm1zrgijahtbymvbdr92.png)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/zxpjrtj175xfnqz9xiqp4bdp.png)

RAG框架

Retrieval-Augmented Generation，检索-增强-生成。

数学语言描述：

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/kem6yctpiv48sl29p3iys7tq.png)

图像语言描述：
![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/pc12ixbc5epq3wdlmptnv27f.png)

chunk大小

(openclaw 的 chunk size 是 700个字符)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/i1tna6l8ybg05zt8kalocqiy.png)

历史 RAG历史

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/j1it6gwlaahgny2o2xyskp10.png)

Embedding原理

问题为何向量

为什么采用向量，为什么不直接通过文本检索？

相似性检索

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/lvdur0t61yvxb7cdpm33mrxt.png)

补充嵌入类型

word embeddings 最常见
embeddings for sentences, paragraphs, or whole documents 适用于RAG

向量空间

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/th3x1dvjgct3rkufsv7p12fc.png)

中文翻译：词在向量空间中的分布式表示通过将相似的词分组，帮助学习算法在自然语言处理任务中实现更好的性能。

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/u973f9c89o07xf4a5k3wd69t.png)

中文翻译：使用神经网络计算的词向量非常有趣，因为学习到的向量明确地编码了许多语言规律和模式。令人惊讶的是，许多这些模式可以表示为线性变换。例如，向量计算 vec("马德里") - vec("西班牙") + vec("法国") 的结果比任何其他词向量都更接近 vec("巴黎")

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/z2xs5adojob88xw4z04350ch.png)

中文翻译：词表示受到其无法表示非词汇组合的习语短语的限制。例如，"Boston Globe"（波士顿环球报）是一份报纸，因此它不是"Boston"（波士顿）和"Globe"（全球）两个词意义的自然组合。因此，使用向量来表示整个短语使Skip-gram模型表达能力大大增强。其他旨在通过组合词向量来表示句子意义的技术，如递归自编码器\[15]，也会从使用短语向量而不是词向量中受益。

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/a8malqvho5n7cxpur8vbbvw8.png)

WordVectors

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/z3ztbocxfujau0h5c7iyclsj.png)

WordAnalogy

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/kc9mqx6nirlm0xq1f63vz0c9.png)

国家-首都

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/zkg450tk8psgjbmkipwq13uu.png)

可视化向量

https://ronxin.github.io/wevi/

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/jen5weq0thl64x5ax8morey6.png)

OpenClaw的记忆机制

OpenClaw

OpenClaw记忆机制 https://docs.openclaw.ai/zh-CN/concepts/memory

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/ey1c0i52y5k8mr4tifm9ozqk.png)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/k956xkmo9twxu87ne71x6af1.png)

AI笔记-大模型应用-RAG

创建于：03-12

随记

讨论

媒体