dbt を使用して Airbyte に読み込まれたデータを変換する方法
概要
このチュートリアルでは、 dbt (データ構築ツール) を使用して、Teradata Vantage の Airbyte (オープンソースの抽出ロード ツール) を介して外部データ ロードを変換する方法を説明します。
このチュートリアルは、元の dbt Jaffleショップチュートリアル をベースに少し変更を加えたもので、 dbt seed
コマンドを使用する代わりに、Airbyte を使用して Jaffle Shop データセットを Google スプレッドシートから Teradata Vantage にロードします。airbyte を通じてロードされたデータは、次の図に示すように JSON 列に含まれています。
前提条件
- Teradata Vantageインスタンスへのアクセス。
注記
Vantage のテストインスタンスが必要な場合は、 https://clearscape.teradata.com で無料でプロビジョニングできます
- サンプルデータ: サンプルデータ Jaffleショップデータセット はGoogle スプレッドシートにあります。
- 参照 dbt プロジェクト リポジトリ: Airbyte との Jaffle プロジェクト。
- Python 3.7、3.8、3.9、3.10、または 3.11 がインストールされています。
サンプルデータのローディ ング
- Airbyteチュートリアルの手順に従います。Airbyte チュートリアルで参照されているデフォルトのデータセットではなく、 Jaffle Shop スプレッドシート からデータをロードするようにしてください。また、Teradata の宛先の
Default Schema
をairbyte_jaffle_shop
に設定します。
注記
AirbyteでTeradata宛先を設定すると、Default Schema
をリクエストされます。Default Schema
を airbyte_jaffle_shop
に設定します。