DataHub MCP 服务器集成

AI Metadata DataHub MCP

联系我们在FlowHunt托管您的MCP服务器

FlowHunt在您的内部系统和AI工具之间提供额外的安全层,让您能够精细控制从MCP服务器可访问哪些工具。托管在我们基础设施中的MCP服务器可以与FlowHunt的聊天机器人以及ChatGPT、Claude和各种AI编辑器等热门AI平台无缝集成。

“DataHub” MCP 服务器的作用是什么?

DataHub MCP(模型上下文协议)服务器是 AI 助手与您的 DataHub 数据生态之间的桥梁。它通过 MCP 标准暴露 DataHub 功能强大的元数据与上下文 API,使 AI 代理能够跨所有实体类型搜索、获取详细元数据、遍历数据血缘并列出相关 SQL 查询。这样可显著提升开发工作流,让 AI 模型直接从您常用的 AI 界面访问最新数据上下文、执行复杂查询,并自动探索元数据。DataHub MCP 服务器同时支持 DataHub Core 和 DataHub Cloud,为希望将元数据平台与 AI 工具与助手集成的组织提供了灵活解决方案。

提示模板列表

在仓库或 README 中未详细说明提示模板。

Logo

准备好发展您的业务了吗?

今天开始免费试用,几天内即可看到结果。

资源原语列表

在仓库或 README 中未描述明确的 MCP 资源原语。

工具列表

  • 跨所有实体类型搜索并支持自定义过滤条件
    允许客户端使用自定义过滤条件查询 DataHub 实体(数据集、仪表盘、数据管道等)。
  • 获取任意实体的元数据
    检索特定 DataHub 实体的全面元数据信息。
  • 遍历血缘图(上游与下游)
    支持对给定实体的上游(来源)和下游(消费方)数据血缘进行探索。
  • 列出与数据集关联的 SQL 查询
    展示与某数据集关联的 SQL 查询,便于审计和理解数据使用情况。

该 MCP 服务器的典型用例

  • 全面数据发现
    开发者和数据科学家可以跨所有 DataHub 实体进行搜索和筛选,加速数据发现并减少手动工作。
  • 自动化元数据获取
    AI 代理可编程地获取详细实体元数据,支持自动文档、质量检查或入职流程。
  • 用于影响评估的血缘分析
    通过遍历上游和下游血缘,团队能即时评估变更影响并改进数据治理。
  • SQL 查询审计
    便捷列出并分析与数据集相关的 SQL 查询,有助于合规监控、性能调优与数据访问优化。
  • 与 AI 驱动代理集成
    将 DataHub 与现代 AI 助手无缝连接,自动化重复性数据管理和探索任务,无论是在聊天还是代码环境下。

如何搭建

Windsurf

在仓库中未找到 Windsurf 专用说明。

Claude

  1. 安装 uv

  2. 使用 which uvx 定位 uvx 命令的完整路径。

  3. 获取您的 DataHub URL 和个人访问令牌。

  4. 编辑您的 claude_desktop_config.json 文件:

    {
      "mcpServers": {
        "datahub": {
          "command": "<full-path-to-uvx>",  // 例如 /Users/hsheth/.local/bin/uvx
          "args": ["mcp-server-datahub"],
          "env": {
            "DATAHUB_GMS_URL": "<your-datahub-url>",
            "DATAHUB_GMS_TOKEN": "<your-datahub-token>"
          }
        }
      }
    }
    
  5. 保存并(重)启 Claude Desktop。在代理界面验证连接。

Cursor

  1. 安装 uv

  2. 获取您的 DataHub URL 和个人访问令牌。

  3. 编辑 .cursor/mcp.json

    {
      "mcpServers": {
        "datahub": {
          "command": "uvx",
          "args": ["mcp-server-datahub"],
          "env": {
            "DATAHUB_GMS_URL": "<your-datahub-url>",
            "DATAHUB_GMS_TOKEN": "<your-datahub-token>"
          }
        }
      }
    }
    
  4. 保存文件并重启 Cursor。检查 MCP 状态面板。

Cline

在仓库中未找到 Cline 专用说明。

通用/其他 MCP 客户端

  1. 安装 uv

  2. 准备您的 DataHub URL 和个人访问令牌。

  3. 使用如下配置:

    command: uvx
    args:
      - mcp-server-datahub
    env:
      DATAHUB_GMS_URL: <your-datahub-url>
      DATAHUB_GMS_TOKEN: <your-datahub-token>
    
  4. 将该命令集成到您的 MCP 客户端配置中。

API 密钥安全

敏感凭证如 DATAHUB_GMS_TOKEN 应始终存储在环境变量中,而非明文文件。在您的配置中,使用如上所示的 env 字段安全注入密钥。

如何在流程中使用此 MCP

在 FlowHunt 中使用 MCP

要将 MCP 服务器集成到 FlowHunt 工作流,首先在您的流程中添加 MCP 组件,并连接到您的 AI 代理:

FlowHunt MCP flow

点击 MCP 组件打开配置面板。在系统 MCP 配置部分,按以下 JSON 格式输入您的 MCP 服务器信息:

{
  "datahub": {
    "transport": "streamable_http",
    "url": "https://yourmcpserver.example/pathtothemcp/url"
  }
}

配置完成后,AI 代理即可作为工具使用该 MCP,全面访问其所有功能。请记得将 “datahub” 替换为您 MCP 服务器的实际名称,并替换为您自己的 MCP 服务器地址。


概览

部分是否可用备注
概览README 和仓库描述中有说明
提示模板列表未找到提示模板
资源原语列表未描述明确的 MCP 资源原语
工具列表README 的功能部分有说明
API 密钥安全搭建说明中有提及环境变量
采样支持(评估时可忽略)README 或代码中未提及

我会给这个 MCP 服务器打 6/10 分。它有明确的开源许可证、多个实际工具和基础安全配置说明,但缺乏文档化的提示模板、资源原语和采样或 roots 等高级 MCP 特性。


MCP 评分

有 LICENSE✅ (Apache-2.0)
有至少一个工具
Fork 数量13
Star 数量37

常见问题

通过 MCP 将 FlowHunt 与 DataHub 连接

借助 DataHub MCP 服务器,为您的 AI 工作流赋能,实时访问组织元数据、血缘和数据发现工具。直接从 FlowHunt 实现数据管理与治理自动化。

了解更多

DataHub MCP 服务器
DataHub MCP 服务器

DataHub MCP 服务器

将 FlowHunt 与 DataHub 的 MCP 服务器集成,实现高级元数据搜索、数据血缘分析和轻松的 SQL 查询列表。利用 AI 简化元数据发现、治理及组织内的数据运营。...

1 分钟阅读
AI DataHub +5
Azure MCP Hub MCP 服务器
Azure MCP Hub MCP 服务器

Azure MCP Hub MCP 服务器

Azure MCP Hub 是一个集中资源中心,用于在 Azure 上发现、构建和集成模型上下文协议(MCP)服务器。它提供指导、SDK 和链接,加速 AI 智能体开发,实现多种编程语言下的真实 API 集成。...

2 分钟阅读
Azure MCP +5
Databricks MCP 服务器
Databricks MCP 服务器

Databricks MCP 服务器

Databricks MCP 服务器将 AI 助手连接到 Databricks 环境,实现对 Unity Catalog 元数据和数据资产的自主探索、理解和交互。它使智能体能够发现数据、构建 SQL 查询,并自动化复杂的分析工作流,无需人工干预。...

2 分钟阅读
AI MCP Server +5