Alliance DAO研究员:深入浅出了解DARK爆火背后的MCP概念
原文作者:Mohamed ElSeidy
原文编译:深潮 TechFlow
导读
昨日,Solana 上的 AI 相关代币 $Dark 上线 Binance Alpha,截止目前市值已经来到 4000 万美元左右。
在最新的加密 AI 叙事中,$Dark 与「MCP」(模型上下文协议)密切相关,而这也是近期谷歌等 Web2 科技公司正在关注和探索的领域。
但在目前,能够清晰讲清楚 MCP 这个概念和叙事影响的文章并不多。
下文是 Alliance DAO 研究员 Mohamed ElSeidy 的一篇关于 MCP 协议深入浅出的文章,以非常通俗的语言讲述了 MCP 的原理和定位,或许对我们快速了解最新的叙事有所帮助。
深潮 TechFlow 对全文进行了编译。
在我于 Alliance 的这些年里,我见证了无数创始人构建了他们自己的专用工具和数据集成,这些都被嵌入到他们的 AI 代理和工作流程中。然而,这些算法、形式化和独特的数据集被锁在定制的集成背后,极少有人会使用。
随着模型上下文协议(Model Context Protocol, MCP)的出现,这种情况正在迅速改变。MCP 被定义为一种开放协议,它标准化了应用程序如何与大型语言模型(LLM)进行通信并提供上下文。我非常喜欢的一个比喻是:「对于 AI 应用程序来说,MCP 就像硬件中的 USB-C」;它是标准化的、即插即用的、多功能的,并且具有变革性。
为什么选择 MCP?
大型语言模型(如 Claude、OpenAI、LLAMA 等)非常强大,但它们受限于当前可以访问的信息。这意味着它们通常存在知识截止点,不能独立浏览网络,也无法直接访问你的个人文件或专用工具,除非进行某种形式的集成。
特别是,在此之前,开发者在将 LLM 连接到外部数据和工具时面临三个主要挑战:
-
集成复杂性:为每个平台(如 Claude、ChatGPT 等)构建单独的集成需要重复努力并维护多个代码库。
-
工具碎片化:每种工具功能(例如,文件访问、API 连接等)都需要自己的专用集成代码和权限模型。
-
分发受限:专用工具被限制在特定平台,限制了它们的覆盖面和影响力。
-
MCP 通过提供一种标准化的方法,使任何 LLM 都能通过通用协议安全地访问外部工具和数据源,从而解决了这些问题。现在我们了解了 MCP 的作用,让我们看看人们正在用它构建什么。
-
人们正在用 MCP 构建什么?
-
MCP 生态系统目前正处于创新爆发期。以下是我在 Twitter 上发现的一些开发者展示其作品的最新示例:
-
AI 驱动的故事板:一种 MCP 集成,使 Claude 能够控制 ChatGPT-4 o,自动生成吉卜力风格的完整故事板,无需任何人工干预。
-
ElevenLabs 语音集成:一个 MCP 服务器,通过简单的文本提示,让 Claude 和 Cursor 访问整个 AI 音频平台。该集成强大到足以创建可以进行外拨电话的语音代理。这展示了 MCP 如何将当前 AI 工具扩展到音频领域。
-
使用 Playwright 进行浏览器自动化:一个 MCP 服务器,使 AI 代理能够控制网页浏览器,而无需截图或视觉模型。这通过标准化方式使 LLM 直接控制浏览器交互,创造了网页自动化的新可能性。
-
个人 WhatsApp 集成:一个连接个人 WhatsApp 账户的服务器,使 Claude 能够搜索消息和联系人,并发送新消息。
-
Airbnb 搜索工具:一个 Airbnb 公寓搜索工具,展示了 MCP 的简便性和创建与网络服务交互的实用应用的能力。
-
机器人控制系统:一个用于机器人的 MCP 控制器。该示例弥合了 LLM 与物理硬件之间的差距,展示了 MCP 在物联网应用和机器人领域的潜力。
-
Google Maps 和本地搜索:将 Claude 连接到 Google Maps 数据,创建一个可以查找和推荐本地企业(如咖啡店)的系统。这一扩展使 AI 助手能够提供基于位置的服务。
-
区块链集成:Lyra MCP 项目将 MCP 功能带到 StoryProtocol 和其他 web3 平台。这允许与区块链数据和智能合约进行交互,为通过 AI 增强的去中心化应用打开了新的可能性。
这些示例尤其引人注目之处在于其多样性。自 MCP 推出以来的短短时间内,开发者已经创建了涵盖创意媒体制作、通信平台、硬件控制、位置服务和区块链技术的集成。这些各种不同的应用遵循同一标准化协议,展示了 MCP 的多功能性及其成为 AI 工具集成通用标准的潜力。
如果想要查看全面的 MCP 服务器集合,可以访问 GitHub 上的官方 MCP 服务器库。在使用任何 MCP 服务器之前,请仔细阅读免责声明,并谨慎对待运行和授权的内容。
承诺与炒作
面对任何新技术,值得问的是:MCP 是否真正具有变革性,还是仅仅是另一个过度炒作、最终会消退的工具?
在观察过众多初创企业后,我相信 MCP 代表了 AI 发展的一次真正的转折点。与许多承诺革命但仅带来渐进变化的趋势不同,MCP 是一种生产力提升,解决了阻碍整个生态系统发展的基础设施问题。
它的特别之处在于,它并不试图替代现有的 AI 模型或与之竞争,而是通过将它们连接到所需的外部工具和数据,使它们更加有用。
尽管如此,关于安全性和标准化的合理担忧仍然存在。正如任何协议在初期阶段一样,随着社区在审计、权限、认证和服务器验证方面摸索最佳实践,我们可能会看到成长的烦恼。开发者需要信任这些 MCP 服务器的功能,不能盲目信任它们,尤其是在它们变得丰富时。本文讨论了一些因盲目使用未经仔细审查的 MCP 服务器而暴露的最近漏洞,即使是在本地运行时。
AI 的未来在于情境化
最强大的 AI 应用将不再是独立的模型,而是通过像 MCP 这样的标准化协议连接起来的专业能力生态系统。对于初创公司来说,MCP 代表了一个构建适合这些不断增长的生态系统的专业组件的机会。这是一个利用您独特知识和能力的机会,同时从基础模型的大量投资中获益。
展望未来,我们可以预期 MCP 将成为 AI 基础设施的基本组成部分,就像 HTTP 之于网络一样。随着协议的成熟和采用的增长,我们很可能会看到专门的 MCP 服务器市场的出现,使 AI 系统能够利用几乎任何想象得到的能力或数据源。
您的初创公司是否尝试过实施 MCP?我很想在评论中听到您的经验。如果您在这个领域构建了有趣的东西,请通过@alliancedao 与我们联系并申请。
附录
对于那些有兴趣了解 MCP 实际工作原理的人,以下附录提供了其架构、工作流程和实施的技术细分。
MCP 的幕后
类似于 HTTP 标准化了网络访问外部数据源和信息的方式,MCP 为 AI 框架做到了这一点,创造了一种通用语言,使不同的 AI 系统能够无缝沟通。让我们来探索它是如何做到的。
MCP 架构和流程
主要架构遵循客户端 - 服务器模型,由四个关键组件协同工作:
-
MCP 主机:包括桌面 AI 应用如 Claude 或 ChatGPT,IDE 如 cursorAI 或 VSCode,或其他需要访问外部数据和功能的 AI 工具。
-
MCP 客户端:嵌入在主机中的协议处理器,维护与 MCP 服务器的一对一连接。
-
MCP 服务器:通过标准化协议暴露特定功能的轻量级程序。
-
数据源:包括文件、数据库、API 和服务,MCP 服务器可以安全访问这些数据。
现在我们已经讨论了这些组件,来看一下它们在典型工作流程中的交互:
-
用户交互:用户在 MCP 主机(例如 Claude Desktop)中提问或发出请求。
-
LLM 分析:LLM 分析请求并确定需要外部信息或工具来提供完整的响应。
-
工具发现:MCP 客户端查询连接的 MCP 服务器以发现可用的工具。
-
工具选择:LLM 根据请求和可用功能决定使用哪些工具。
-
权限请求:主机向用户请求执行所选工具的权限,以确保透明性和安全性。
-
工具执行:在获得批准后,MCP 客户端将请求发送到适当的 MCP 服务器,服务器利用其对数据源的专业访问来执行操作。
-
结果处理:服务器将结果返回给客户端,客户端将其格式化以供 LLM 使用。
-
响应生成:LLM 将外部信息整合成全面的响应。
-
用户展示:最终,响应呈现给终端用户。
这种架构的强大之处在于,每个 MCP 服务器专注于特定领域,但使用标准化的通信协议。这样,开发者无需为每个平台重建集成,只需一次性开发工具即可服务于整个 AI 生态系统。
如何构建您的第一个 MCP 服务器
现在让我们看看如何使用 MCP SDK 在几行代码中实现一个简单的 MCP 服务器。
在这个简单的例子中,我们希望扩展 Claude Desktop 的能力,让它能够回答诸如「中央公园附近有哪些咖啡店?」这样的问题,信息来源于谷歌地图。您可以轻松扩展此功能以获取评论或评分。但现在,我们专注于 MCP 工具 find_nearby_places,它将允许 Claude 直接从谷歌地图获取这些信息,并以对话的方式呈现结果。
正如您所见,代码非常简单。首先,它将查询转换为谷歌地图 API 搜索,然后返回结构化格式的顶级结果。这样,信息被传递回 LLM 以便进一步决策。
现在我们需要让 Claude Desktop 知道这个工具,因此我们在其配置文件中注册它,如下所示:
macOS 路径:~/Library/Application Support/Claude/claude_desktop_config.jsonWindows 路径:%APPDATA%\Claude\claude_desktop_config.json
就这样,你完成了!现在你已经成功扩展了 Claude 的功能,可以实时从谷歌地图中查找位置。