Skip to main content

テーブルのマージ

データ書込In-DB ツールは、Databricks Unity Catalogに接続されたワークフローのテーブルマージ機能をサポートしています。このオプションは、入力レコード(ソース)に基づいた一連の更新または削除をターゲットのDeltaテーブル(ターゲット)にマージします。

Databricksのドキュメント で説明されているように、MERGE INTOステートメントが使用されます。

データ書込In-DBツールでテーブルのマージを設定するには:

  1. [In-DB接続の管理] ダイアログを使用して、Databricks Unity Catalog接続を作成します。

  2. ソースデータを作成するには、次のオプションのいずれかを選択します。

    • 接続In-DBツール をDatabricks Unity Catalog接続に接続し、テーブルマージのソースデータとして使用されるテーブルにマップします。

    • データストリーム入力ツール を使用して、外部データセットのデータをDatabricksに取り込み、ソースデータとして使用します。

  3. データ書込In-DBツール をワークフローに接続し、出力モードとして [テーブルのマージ] を選択します。

    • [テーブルのマージ] は、ツールがDatabricks Unity Catalog接続を検出できる場合にのみ使用できます。

  4. ターゲットテーブル名 を入力します。これは変更するテーブルです。このテーブルはDeltaテーブルである必要があります。

  5. [適用] を選択して、ターゲットテーブル名を保存し、マージフィールドを更新します。

  6. ドロップダウンから [マージフィールド] を選択します。マージフィールドのセットを少なくとも1つ選択する必要があります。

  7. 一致アクション を選択します。

    • 削除: ターゲットテーブル内の一致するテーブル行をすべて削除します。

    • 更新: 一致するターゲットテーブル行をソースデータで更新します。

      • 名前による自動設定: ソースデータのフィールドをターゲットテーブルに自動的にマッピングします。ソースデータの余分なフィールドは無視されます。フィールドが見つからないと、ワークフローは失敗します。

      • カスタム: ソースデータのフィールドをターゲットテーブルに手動で一致させます。すべてのフィールドをマッピングする必要があります。ターゲットフィールドを [なし] にすることはできません。フィールドが見つからないと、ワークフローは失敗します。