Skip to main content

Databricks 卷

连接类型

ODBC(64 位)

驱动程序配置要求

主机必须是 Databricks Unity Catalog 集群 JDBC/ODBC 服务器主机名。

支持类型

数据库内写入

验证版本

Databricks 群集和 SQL Warehouse Simba Apache Spark 驱动程序 2.6.23.1039

驱动程序详细信息

数据库内处理需要 64 位数据库驱动程序。

用于连接的 Alteryx 工具

数据库内工作流处理

小心

  • 只有使用 DCM 才支持 Databricks Volumes。

  • 只有使用非 DSN 连接才支持 Databricks Volume。

  • Databricks Volume 仅在 Unity Catalog 受支持。

  • 只有使用库内工具才支持写入 Databricks Unity Catalog。

  • Alteryx 支持 MergeInDB for Databricks Unity Catalog,请转至库内写入数据工具

配置库内连接

  1. 打开管理库内连接窗口。

  2. 数据源下拉列表中选择 Databricks Unity Catalog

  3. 选择新建以创建新连接。

  4. 输入连接名称。

  5. 读取选项卡上,选择设置连接以针对 Databricks Unity Catalog 打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Apache Spark - Simba Databricks Unity Catalog ODBC 非 DSN 连接

  6. 选择现有连接或选择 +新建以创建新连接。转至 Databricks Unity Catalog 了解如何使用 DCM 配置新连接。

  7. 写入选项卡上,选择下拉列表中的 Databricks UC Volumes 批量加载程序 (Avro)

  8. 选择设置连接以针对 Databricks 连接打开 DCM 连接管理器。DCM 连接管理器经过预筛选,仅显示 Apache Spark - Databricks UC Volumes ODBC 批量非 DSN 连接。

  9. 选择现有连接或选择 +新建以创建新连接。如需了解如何使用 DCM 配置新连接,请参阅下文。

  10. 选择应用确定以保存连接并关闭窗口。

  11. 如果通过库内连接工具来访问库内连接管理器,则选择表格或指定查询窗口将加载并允许选择表格。

在 DCM 中配置 Apache Spark - Databricks UC Volumes ODBC 批量非 DSN 连接

此连接用于使用 Volumes 暂存将数据写入 Databricks Unity Catalog。

  1. 打开数据连接管理器并导航至 Apache Spark - Databricks UC Volumes ODBC 批量非 DSN 连接

    - 在输入工具或库内连接管理器中,DCM 已经过预筛选。

    - 从文件菜单中,转至文件 > 管理连接 > +新建 > Apache Spark > Apache Spark - Databricks UC Volumes ODBC 批量非 DSN 连接

  2. 输入数据源名称

  3. 输入 Databricks Unity Catalog 主机名称。

  4. 端口默认设置为 443。根据需要进行更改。

  5. 输入 http 路径。http 路径是 Databricks 计算资源 URL。

  6. 输入目录。这将设置用于写入数据和创建表格的目录。

  7. 输入架构。这将设置用于写入数据和创建表格的架构。

  8. /Volumes/<catalog>/<schema>/<volume>/<path/to/folder> 格式输入 Databricks 卷的完整路径。

  9. 选择保存以保存数据源。

  10. 选择 +连接凭证以添加凭证。

    1. 选择身份验证方法

    2. 要使用个人访问令牌,请选择用户名和密码作为验证方法,并将用户名设置为“token”。

    3. 要使用 Azure AD,请参阅 Databricks Azure OAuth 身份验证

    4. 选择现有凭据或选择创建新凭据以创建新凭据,然后输入个人访问令牌或 Azure AD 的信息。

  11. 选择链接以将凭证链接到数据源。

  12. 选择连接