DataHub MCP 服务器集成

DataHub MCP 服务器集成

使用 MCP 服务器将 FlowHunt AI 代理与您组织的 DataHub 集成,直接在 AI 工作流中解锁强大的元数据搜索、血缘探索和自动 SQL 审计功能。

“DataHub” MCP 服务器的作用是什么?

DataHub MCP(模型上下文协议)服务器是 AI 助手与您的 DataHub 数据生态之间的桥梁。它通过 MCP 标准暴露 DataHub 功能强大的元数据与上下文 API,使 AI 代理能够跨所有实体类型搜索、获取详细元数据、遍历数据血缘并列出相关 SQL 查询。这样可显著提升开发工作流,让 AI 模型直接从您常用的 AI 界面访问最新数据上下文、执行复杂查询,并自动探索元数据。DataHub MCP 服务器同时支持 DataHub Core 和 DataHub Cloud,为希望将元数据平台与 AI 工具与助手集成的组织提供了灵活解决方案。

提示模板列表

在仓库或 README 中未详细说明提示模板。

资源原语列表

在仓库或 README 中未描述明确的 MCP 资源原语。

工具列表

  • 跨所有实体类型搜索并支持自定义过滤条件
    允许客户端使用自定义过滤条件查询 DataHub 实体(数据集、仪表盘、数据管道等)。
  • 获取任意实体的元数据
    检索特定 DataHub 实体的全面元数据信息。
  • 遍历血缘图(上游与下游)
    支持对给定实体的上游(来源)和下游(消费方)数据血缘进行探索。
  • 列出与数据集关联的 SQL 查询
    展示与某数据集关联的 SQL 查询,便于审计和理解数据使用情况。

该 MCP 服务器的典型用例

  • 全面数据发现
    开发者和数据科学家可以跨所有 DataHub 实体进行搜索和筛选,加速数据发现并减少手动工作。
  • 自动化元数据获取
    AI 代理可编程地获取详细实体元数据,支持自动文档、质量检查或入职流程。
  • 用于影响评估的血缘分析
    通过遍历上游和下游血缘,团队能即时评估变更影响并改进数据治理。
  • SQL 查询审计
    便捷列出并分析与数据集相关的 SQL 查询,有助于合规监控、性能调优与数据访问优化。
  • 与 AI 驱动代理集成
    将 DataHub 与现代 AI 助手无缝连接,自动化重复性数据管理和探索任务,无论是在聊天还是代码环境下。

如何搭建

Windsurf

在仓库中未找到 Windsurf 专用说明。

Claude

  1. 安装 uv

  2. 使用 which uvx 定位 uvx 命令的完整路径。

  3. 获取您的 DataHub URL 和个人访问令牌。

  4. 编辑您的 claude_desktop_config.json 文件:

    {
      "mcpServers": {
        "datahub": {
          "command": "<full-path-to-uvx>",  // 例如 /Users/hsheth/.local/bin/uvx
          "args": ["mcp-server-datahub"],
          "env": {
            "DATAHUB_GMS_URL": "<your-datahub-url>",
            "DATAHUB_GMS_TOKEN": "<your-datahub-token>"
          }
        }
      }
    }
    
  5. 保存并(重)启 Claude Desktop。在代理界面验证连接。

Cursor

  1. 安装 uv

  2. 获取您的 DataHub URL 和个人访问令牌。

  3. 编辑 .cursor/mcp.json

    {
      "mcpServers": {
        "datahub": {
          "command": "uvx",
          "args": ["mcp-server-datahub"],
          "env": {
            "DATAHUB_GMS_URL": "<your-datahub-url>",
            "DATAHUB_GMS_TOKEN": "<your-datahub-token>"
          }
        }
      }
    }
    
  4. 保存文件并重启 Cursor。检查 MCP 状态面板。

Cline

在仓库中未找到 Cline 专用说明。

通用/其他 MCP 客户端

  1. 安装 uv

  2. 准备您的 DataHub URL 和个人访问令牌。

  3. 使用如下配置:

    command: uvx
    args:
      - mcp-server-datahub
    env:
      DATAHUB_GMS_URL: <your-datahub-url>
      DATAHUB_GMS_TOKEN: <your-datahub-token>
    
  4. 将该命令集成到您的 MCP 客户端配置中。

API 密钥安全

敏感凭证如 DATAHUB_GMS_TOKEN 应始终存储在环境变量中,而非明文文件。在您的配置中,使用如上所示的 env 字段安全注入密钥。

如何在流程中使用此 MCP

在 FlowHunt 中使用 MCP

要将 MCP 服务器集成到 FlowHunt 工作流,首先在您的流程中添加 MCP 组件,并连接到您的 AI 代理:

FlowHunt MCP flow

点击 MCP 组件打开配置面板。在系统 MCP 配置部分,按以下 JSON 格式输入您的 MCP 服务器信息:

{
  "datahub": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI 代理即可作为工具使用该 MCP,全面访问其所有功能。请记得将 “datahub” 替换为您 MCP 服务器的实际名称,并替换为您自己的 MCP 服务器地址。


概览

部分是否可用备注
概览README 和仓库描述中有说明
提示模板列表未找到提示模板
资源原语列表未描述明确的 MCP 资源原语
工具列表README 的功能部分有说明
API 密钥安全搭建说明中有提及环境变量
采样支持(评估时可忽略)README 或代码中未提及

我会给这个 MCP 服务器打 6/10 分。它有明确的开源许可证、多个实际工具和基础安全配置说明,但缺乏文档化的提示模板、资源原语和采样或 roots 等高级 MCP 特性。


MCP 评分

有 LICENSE✅ (Apache-2.0)
有至少一个工具
Fork 数量13
Star 数量37

常见问题

DataHub MCP 服务器的作用是什么?

它通过 MCP 标准暴露 DataHub 的元数据和上下文 API,使 AI 代理能够直接从 FlowHunt 或其他 AI 工具搜索、检索元数据、遍历血缘,并列出组织数据上的 SQL 查询。

支持哪些 DataHub 平台?

支持 DataHub Core 和 DataHub Cloud,无论您的部署方式如何都可连接。

主要使用场景有哪些?

常见场景包括全面数据发现、自动元数据获取、用于影响评估的血缘分析、SQL 查询审计,以及与 AI 助手集成实现工作流自动化。

如何安全地提供凭证?

敏感凭证如 DATAHUB_GMS_TOKEN 应始终使用环境变量。通过配置文件中的 'env' 字段注入,以确保密钥安全。

是否包含提示模板或资源原语?

此服务器未包含明确的提示模板或 MCP 资源原语。

此 MCP 服务器提供了哪些工具?

它支持对所有实体类型的搜索、元数据获取、血缘遍历,以及列出与数据集相关联的 SQL 查询。

如何将 DataHub MCP 连接到 FlowHunt?

在 FlowHunt 流程中添加一个 MCP 组件,按照文档配置您的 DataHub MCP 服务器 JSON,并将其连接到 AI 代理,立刻获取 DataHub 能力。

通过 MCP 将 FlowHunt 与 DataHub 连接

借助 DataHub MCP 服务器,为您的 AI 工作流赋能,实时访问组织元数据、血缘和数据发现工具。直接从 FlowHunt 实现数据管理与治理自动化。

了解更多

Azure MCP Hub MCP 服务器
Azure MCP Hub MCP 服务器

Azure MCP Hub MCP 服务器

Azure MCP Hub 是一个集中资源中心,用于在 Azure 上发现、构建和集成模型上下文协议(MCP)服务器。它提供指导、SDK 和链接,加速 AI 智能体开发,实现多种编程语言下的真实 API 集成。...

2 分钟阅读
Azure MCP +5
Databricks MCP 服务器
Databricks MCP 服务器

Databricks MCP 服务器

Databricks MCP 服务器将 AI 助手连接到 Databricks 环境,实现对 Unity Catalog 元数据和数据资产的自主探索、理解和交互。它使智能体能够发现数据、构建 SQL 查询,并自动化复杂的分析工作流,无需人工干预。...

2 分钟阅读
AI MCP Server +5
模型上下文协议 (MCP) 服务器
模型上下文协议 (MCP) 服务器

模型上下文协议 (MCP) 服务器

模型上下文协议(MCP)服务器将 AI 助手与外部数据源、API 和服务连接起来,实现复杂工作流的无缝集成,并在 FlowHunt 中安全管理开发任务。...

1 分钟阅读
AI MCP +4