Dify实现Mcp和知识库调用

Dify 是一个用于开发 LLM 应用程序的开源平台，功能类似Cherry Studio。整合了工作流、RAG、Agent、模型管理、调用监控、API开放等功能，能够快速构建生产环境使用的业务处理流程。

本文主要演示在Dify中如何搭建一个智能的工作流，用于解决企业中的一些典型场景问题，例如智能客服、知识库查询、企业内智能OA调用，无论是标准化流程（如客服、审批）还是个性化需求（如行业定制模型），Dify 均能通过灵活的工作流设计与企业级安全架构灵活解决。

总而言之Dify功能非常强大，适用的领域也很广泛，产品经理不需要编写代码就可以实现很复杂的业务流程，团队效率大幅提升，而对于用户而言只需要自然语言就可以解决问题，也就是说只需要动动嘴皮子就能让Agent帮你完成所有的业务需求。开始之前需要了解几个基本概念。

MCP基本介绍

MCP(模型上下文协议) 是一个开放协议，它规范了应用程序如何向 LLM 提供上下文。可以将 MCP 想象成 AI 应用程序的 USB-C 接口。

就像 USB-C 为设备连接各种外设和配件提供了标准化方式一样，MCP 为 AI 模型连接不同的数据源和工具提供了标准化方式，类似Call Function 以及 RPC 框架。

总而言之，Mcp 就是把Http接口按照统一的规范暴露给给模型，一般是一个SSE接口，让模型知道这个Mcp工具具备哪些能力，以便于当用户提问涉及到这类问题的时候模型可以自主调用Mcp接口进行解答，既然是统一的标准，那么不管使用什么语言进行开发都是可以的，只需要保证数据格式一致即可。

MCP基本介绍

RAG基本介绍

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合信息检索与生成式 AI的技术框架，核心目的是让大语言模型（LLM）在生成回答时，能够基于外部知识库的精准信息，而非仅依赖模型训练时的内部数据，从而提升输出内容的准确性、可靠性和针对性。

为什么需要RAG

大语言模型（如 GPT、LLaMA 等）的局限性在于：

知识滞后：训练数据截止到特定时间（如 GPT-4 截止到 2023 年 4 月），无法覆盖最新信息（如 2024 年的政策、企业内部更新的文档）。
幻觉问题：当面对陌生领域或细节问题时，可能生成看似合理但错误的内容（“一本正经地胡说八道”）。
领域限制：通用模型对垂直领域（如医疗、法律、企业内部流程）的专业知识覆盖不足。

RAG 通过 “先检索、再生成” 的逻辑解决这些问题：

检索：从外部知识库（如企业文档、专业数据库、网页等）中精准找到与问题相关的信息片段。
增强：将检索到的信息作为 “上下文” 喂给大语言模型，让模型基于这些事实生成回答。

RAG 的技术流程：三步实现检索增强

一个完整的 RAG 系统通常包含数据准备、检索、生成三个核心环节，具体流程有以下几个步骤：

数据准备

数据收集：整合企业内部文档（PDF、Word、Excel）、行业报告、网页内容、数据库记录等非结构化 / 结构化数据。
数据处理（清洗与拆分）：

1、去除冗余信息（如广告、格式错误）。

2、将长文档拆分为 chunk（片段，通常几百字），避免因文本过长导致检索精度下降。例如，一本 500 页的产品手册可能被拆分为 1000 + 个片段。

向量嵌入（Embedding）：

1、通过嵌入模型（如 OpenAI 的 Ada、开源的 BERT、Sentence-BERT）将每个文本片段转换为向量（Vector）—— 一种能表示文本语义的数字序列。

2、向量的核心作用是：将 “语义相似” 的文本映射到向量空间的 “邻近区域”（例如，“如何申请退款” 和 “退款流程是什么” 的向量会非常接近）。

3、向量存储：将所有文本片段的向量存入向量数据库（如 Pinecone、Milvus、FAISS），方便后续快速检索。

例：企业将 2024 年新员工手册拆分为 100 个片段，每个片段转换为 768 维向量，存入向量数据库。

检索

当用户输入问题（如 “新员工试用期多久？”）时：

1、问题向量化：用与知识库相同的嵌入模型，将用户问题转换为向量。
2、相似性检索：向量数据库计算 “问题向量” 与 “知识库中所有片段向量” 的相似度，返回最相关的 Top N 个片段（通常 3-5 个）。例如，用户问 “试用期”，系统会从员工手册片段中找到包含 “试用期时长”“试用期考核” 等内容的片段。
3、过滤与排序（ReRank）：可选步骤，通过关键词匹配、权限过滤（如敏感文档仅特定人可见）等进一步优化结果。