AI及MCP-学习

AI及MCP-学习

AI及MCP

AI历史简述

图灵测试

[https://book.douban.com/subject/10750155/](https://book.douban.com/subject/10750155/)

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/l2z55fhqacz2i18oxllakl7z.png)image.png

机器翻译

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/bsjg1cmab2152s5onyovcxrr.png)image.png

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/ft5f5z9lzsqy3pwejjabbeba.png)image.png

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/jw7f0r3xwb2jcbapime8spr9.png)image.png

机器实现智能的方式不需要与人一样,这个规律同样适用于当前的大模型。既然不一样,也就带来了一些独特的优点与缺点。

深度学习
  1. https://zhuanlan.zhihu.com/p/29096536

  2. TPU Tensor Processing Unit (TPU)

  • **深度学习**:源于传统的神经网络,但在21世纪初,得益于理论突破(如ReLU激活函数、Dropout等)和算力增长,**深度学习**(具有多个隐藏层的神经网络)开始展现出强大威力。

  • **显卡 (GPU) 的关键作用**:研究者发现,原本为处理图形图像而设计的**GPU**,其并行计算架构非常适合深度学习所需的大规模矩阵运算。GPU极大地加速了模型训练,使得训练更深、更复杂的神经网络成为可能,直接催生了AI的现代复兴。

这也是为什么这些年显卡越来越贵的原因,尤其到了大模型时代。

计算机视觉
  • **ImageNet竞赛与AlexNet (2012年)**:在ImageNet图像识别大赛中,**AlexNet**(一个深度卷积神经网络)以远超传统方法的准确率获胜,震惊学界,开启了**计算机视觉**的深度学习时代。

  • **预训练 (Pretraining) 范式的确立**:研究者发现,在一个大型数据集(如ImageNet)上**预训练**好的模型,其学到的底层特征(如边缘、纹理)具有通用性。通过**微调**,可以高效地适配到其他视觉任务上。这一“预训练-微调”范式,为后来的**GPT**等大语言模型提供了关键思路。

GPT 的 英文是 `generative pre-trained transformer`,这里的 pre-trained 正是从计算机视觉借鉴而来。

阿尔法狗
  • **事件**:2016年,DeepMind开发的**阿尔法狗**击败世界围棋冠军李世石。

  • **技术核心**:它结合了**深度学习**(用于评估棋局和选择落子点)和**强化学习**(通过自我对弈不断优化策略)。

  • **意义**:证明了AI在高度复杂的非完美信息博弈中可以达到超越人类的水平。其后续版本AlphaZero等展示了更通用的强化学习能力。**DeepSeek-R1** 正是这一技术路线的延续,它利用类似AlphaGo的强化学习技术来优化大语言模型,使其回答更准确、逻辑更严谨。

  1. DeepSeek-R1 的 R 就是指 `reinforcement learning`,deepseek 在25年初取得爆火的关键正是强化学习。

  2. 阿尔法狗的出现,也改变了所有围棋选手的命运

大模型时代
  • **核心特征**:指拥有**千亿**甚至**万亿**级参数的巨型语言模型,其代表是**GPT系列**

  • **范式转变**:研究发现,当模型规模和训练数据达到一定程度时,会涌现出小模型不具备的**推理、泛化**等能力。

  • **影响**:大模型成为了强大的基础模型,通过提示工程或微调,可以应对各种各样前所未有的任务,推动了生成式AI的爆发,并正在重塑人机交互和信息产业。

AI应用简述

AI应用简述
  1. AI在大模型出现之前就已经广泛应用于我们的生活

  2. 当前“AI”这个词多数情况下都是指“大模型”,但是“AI”这个词实际上可指代对象非常宽泛,有时候在交流时需要约束一下,确保双方交流的是同一件事,避免鸡同鸭讲。

  3. 下图所示只是冰山一角,还有很多很多应用和模型:gemini3,通义万相等等。

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/tqzl8po4my7nam35vx4rlw7u.png)image.png

MCP

查询天气

先讲讲MCP有什么用,能解决什么问题:

直接问大语言模型 "纽约明天的天气怎么样"这类问题无法得到答案,因为大模型仅具备训练时学习到的知识,并不知道当前时间的事。所以需要加上一些外部工具,如可以查询天气的MCP server,从而能够回答这类问题。

不开启搜索引擎工具,查询“纽约明天的天气怎么样”

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/xw7v8l1gijibnehrbzq52z5q.png)image.png

以 Cline 为例,加上 weather 这个MCP server后:

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/qbtlrwbkckpoin2uqts2aixj.png)image.png

查询天气流程

参考:

先从流程图上看MCP的完整流程,再深入到代码细节上。

![image.png](https://cdn.modevol.com/user/ckxe4nrot01l501s5g2ehd6ge/images/hw742b3jbf2nyjbxfxcau9re.png)image.png

闪存类比

大模型与智能体(Agent)的关系,可类比于NAND闪存与固态硬盘(SSD)的关系。

  • **NAND层面**的特性(如“先擦后写”、读写干扰、磨损)限制了其直接用作存储;**SSD**通过FTL(地址转换)、垃圾回收、磨损均衡等算法,将这些基础单元构建成可靠、高效的存储设备。

  • 同理,**大模型**自身的限制(如知识滞后、无法自主更新、上下文窗口有限、幻觉等)也阻碍了其直接应用于复杂场景;**Agent**通过引入RAG、思维链(ReAct)、搜索引擎、MCP服务器等工具,极大地扩展了其处理复杂任务的能力。

幻觉,简单来说就是“正儿八经地胡说八道”,生成的语句满足语法却不符合实际。

AI及MCP-学习
Mleon的头像
创建于:2025-12-31
随记
讨论
媒体