CtrlK

AI及MCP-学习

AI及MCP

图灵测试

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/l2z55fhqacz2i18oxllakl7z.png)

机器翻译

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/bsjg1cmab2152s5onyovcxrr.png)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/ft5f5z9lzsqy3pwejjabbeba.png)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/jw7f0r3xwb2jcbapime8spr9.png)

机器实现智能的方式不需要与人一样，这个规律同样适用于当前的大模型。既然不一样，也就带来了一些独特的优点与缺点。

深度学习

**深度学习**：源于传统的神经网络，但在21世纪初，得益于理论突破（如ReLU激活函数、Dropout等）和算力增长，**深度学习**（具有多个隐藏层的神经网络）开始展现出强大威力。
**显卡 (GPU) 的关键作用**：研究者发现，原本为处理图形图像而设计的**GPU**，其并行计算架构非常适合深度学习所需的大规模矩阵运算。GPU极大地加速了模型训练，使得训练更深、更复杂的神经网络成为可能，直接催生了AI的现代复兴。

这也是为什么这些年显卡越来越贵的原因，尤其到了大模型时代。

计算机视觉

**ImageNet竞赛与AlexNet (2012年)**：在ImageNet图像识别大赛中，**AlexNet**（一个深度卷积神经网络）以远超传统方法的准确率获胜，震惊学界，开启了**计算机视觉**的深度学习时代。
**预训练 (Pretraining) 范式的确立**：研究者发现，在一个大型数据集（如ImageNet）上**预训练**好的模型，其学到的底层特征（如边缘、纹理）具有通用性。通过**微调**，可以高效地适配到其他视觉任务上。这一“预训练-微调”范式，为后来的**GPT**等大语言模型提供了关键思路。

GPT 的英文是 `generative pre-trained transformer`，这里的 pre-trained 正是从计算机视觉借鉴而来。

阿尔法狗

**事件**：2016年，DeepMind开发的**阿尔法狗**击败世界围棋冠军李世石。
**技术核心**：它结合了**深度学习**（用于评估棋局和选择落子点）和**强化学习**（通过自我对弈不断优化策略）。
**意义**：证明了AI在高度复杂的非完美信息博弈中可以达到超越人类的水平。其后续版本AlphaZero等展示了更通用的强化学习能力。**DeepSeek-R1** 正是这一技术路线的延续，它利用类似AlphaGo的强化学习技术来优化大语言模型，使其回答更准确、逻辑更严谨。

DeepSeek-R1 的 R 就是指 `reinforcement learning`，deepseek 在25年初取得爆火的关键正是强化学习。
阿尔法狗的出现，也改变了所有围棋选手的命运

大模型时代

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/tqzl8po4my7nam35vx4rlw7u.png)

查询天气

先讲讲MCP有什么用，能解决什么问题：

直接问大语言模型 "纽约明天的天气怎么样"这类问题无法得到答案，因为大模型仅具备训练时学习到的知识，并不知道当前时间的事。所以需要加上一些外部工具，如可以查询天气的MCP server，从而能够回答这类问题。

不开启搜索引擎工具，查询“纽约明天的天气怎么样”

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/xw7v8l1gijibnehrbzq52z5q.png)

以 Cline 为例，加上 weather 这个MCP server后:

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/qbtlrwbkckpoin2uqts2aixj.png)

查询天气流程

参考:

先从流程图上看MCP的完整流程，再深入到代码细节上。

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/hw742b3jbf2nyjbxfxcau9re.png)

闪存类比

大模型与智能体（Agent）的关系，可类比于NAND闪存与固态硬盘（SSD）的关系。

**NAND层面**的特性（如“先擦后写”、读写干扰、磨损）限制了其直接用作存储；**SSD**通过FTL（地址转换）、垃圾回收、磨损均衡等算法，将这些基础单元构建成可靠、高效的存储设备。
同理，**大模型**自身的限制（如知识滞后、无法自主更新、上下文窗口有限、幻觉等）也阻碍了其直接应用于复杂场景；**Agent**通过引入RAG、思维链（ReAct）、搜索引擎、MCP服务器等工具，极大地扩展了其处理复杂任务的能力。

幻觉，简单来说就是“正儿八经地胡说八道”，生成的语句满足语法却不符合实际。

AI及MCP-学习

创建于：2025-12-31

随记

讨论

媒体