
Databricks MCP 的 AI 代理
赋能您的 AI 代理,借助模型上下文协议(MCP)服务器,自动探索、理解与查询 Databricks 环境。利用全面的 Unity Catalog 元数据、高级血缘追踪及代码级分析,自动生成精准 SQL,从数据生态中获得可执行洞察——无需人工干预。

自主数据发现与血缘探索
让您的 AI 代理独立探索 Databricks Unity Catalog,发现目录、模式、表及丰富的字段元数据。MCP 服务器可无缝收集上下文,深度追踪血缘(包括代码、笔记本与作业依赖),并为精准、合规的 SQL 生成提供可执行洞察。
- 全面目录导航.
- 代理可列出并描述 Unity Catalog 目录、模式、表和字段,汇聚全部元数据以辅助构建查询。
- 自动血缘追踪.
- 追踪表、笔记本和作业的依赖,实现完整影响分析和强健数据治理。
- 代码级探索.
- AI 代理可识别并分析实际的数据转换与质量检查所用代码及业务逻辑。
- 语义元数据访问.
- 利用每一级(目录、模式、表、字段)的详细描述,获得更丰富的上下文、清晰度和准确性。

智能 SQL 查询生成
将您的 Databricks 元数据转化为可执行洞察。凭借对数据结构及关系的丰富上下文,AI 代理生成准确、语义正确的 SQL——减少错误,加速分析,同时遵循数据治理和权限要求。
- 执行 SQL 查询.
- 代理可通过 Databricks SDK 执行任意 SQL,适用于定向数据检索和分析。
- LLM 优化输出.
- 所有描述性工具均返回 Markdown,优化 LLM 解析与上下文收集体验。
- 权限感知型操作.
- 所有查询与探索均遵循 Databricks Unity Catalog 和 SQL Warehouse 权限,实现安全数据访问。

AI 驱动元数据管理的生产化
通过将元数据代码化,加速您的数据工作流——用 Terraform 管理、自动化和审计 Unity Catalog 资产,为生产级 AI 工作流提供安全、可扩展的访问。保障合规、可审计,并与 Cursor、Agent Composer 等工具无缝集成。
- 安全、可审计访问.
- 利用细粒度权限与基于令牌的访问,实现安全合规操作与便捷审计追踪。
- 基础设施即代码.
- 通过 Terraform 编程化管理 Unity Catalog 资产和元数据,实现一致且可版本化的部署。
MCP 集成
可用的 Databricks MCP 集成工具
以下工具作为 Databricks MCP 集成的一部分提供:
- list_uc_catalogs
列出所有可用的 Unity Catalog,包括名称、描述与类型,便于数据源发现。
- describe_uc_catalog
提供指定 Unity Catalog 的摘要,列出其全部模式及各自的名称和描述。
- describe_uc_schema
给出模式的详细信息,包括其表以及可选的字段信息。
- describe_uc_table
全面描述 Unity Catalog 表,包括结构和血缘信息。
- execute_sql_query
在 Databricks SQL warehouse 上执行 SQL 查询,并返回格式化结果。
释放 AI 驱动数据探索的力量
赋能您的团队,结合 LLM 代理与 Databricks Unity Catalog 元数据,实现更智能、自主的数据发现与查询生成。体验无缝的数据血缘分析和代码探索,最大化已记录资产的价值。
什么是 Databricks
Databricks 是一家全球领先的数据、分析与人工智能(AI)公司,由 Apache Spark 的原始创造者于 2013 年创立。该公司提供统一分析平台,使组织能够无缝集成数据工程、数据科学、机器学习和分析。Databricks 赋能全球超过 10,000 家组织(包括财富 500 强企业)管理海量数据、简化 ETL 流程,并加速 AI 解决方案的开发与部署。该平台以其协作式工作空间闻名,桥接数据工程师、数据科学家与业务分析师间的协作鸿沟,助力数据驱动决策的创新与高效。
能力
我们可以用 Databricks 做什么
借助 Databricks,用户可释放统一数据分析的力量,实现 AI 与机器学习项目的无缝协作和快速扩展。该平台使组织能够集成和处理大规模数据集,构建和部署机器学习模型,并在安全协作的环境中获得可执行洞察。
- 统一分析
- 在单一平台集成 ETL、数据工程、数据科学与分析。
- 协作式工作空间
- 通过共享笔记本和工具,促进数据工程师、科学家与分析师的团队协作。
- 可扩展机器学习
- 利用行业标准框架,大规模构建、训练与部署机器学习模型。
- 数据仓库
- 简化数据仓库,实现实时分析与强大数据管理功能。
- 端到端安全
- 为敏感数据工作流提供企业级安全、治理与合规保障。

AI 代理如何受益于 Databricks
AI 代理可借助 Databricks 实现数据处理、模型训练与实时分析的自动化与加速。通过集成 Databricks,AI 代理获得可扩展的计算资源、协作工具与丰富的数据管道,从而提升洞察生成、决策自动化与在动态业务环境中交付有影响力成果的能力。