Azure Data Share を Teradata Vantage に接続する
概要
この記事では、Azure Data Share サービスを使用して Azure Blob Storage データセットをあるユーザーから別のユーザーと共有し、ネイティブ オブジェクト ストア (NOS) 機能を活用して Teradata Vantage でクエリーを実行するプロセスについて説明します。両方のユーザーに対してストレージ アカウントとデータ共有アカウントを作成して使用します。
これは、ワークフローの図です。
Azure Data Shareについて
Azure データ共有 を使用すると、組織は複数の顧客やパートナーとデータを簡単かつ安全に共有できます。データを共有および受信するには、データ プロバイダとデータ コンシューマーの両方が Azure サブスクリプションを持っている必要があります。Azure Data Share は現在、スナップショット ベースの共有とインプレース共有を提供しています。現在、Azure Data Share サポートされているデータストア には、Azure Blob Storage、Azure Data Lake Storage Gen1 および Gen2、Azure SQL Database、Azure Synapse Analytics、Azure Data Explorer が含まれます。Azure Data Share を使用してデータセット共有が送信されると、データ コンシューマーは Azure Blob Storage などの任意のデータ ストアでそのデータを受信し、Teradata Vantage を使用してデータを探索および分析できます。
詳細については、ドキュメントを参照してください。
Teradata Vantage について
Vantageは、データウェアハウス、データレイク、アナリティクスを単一の接続されたエコシステムに統合する最新のクラウドプラットフォームです。
Vantageは、記述的分析、予測的分析、処方的分析、自律的意思決定、ML機能、可視化ツールを統合したプラットフォームで、データの所在を問わず、リアルタイムのビジネスインテリジェンスを大規模に発掘することが可能です。
Vantageは、小規模から始めて、コンピュートやストレージを弾力的に拡張し、使用した分だけ支払い、低コストのオブジェクトストアを活用し、分析ワークロードを統合することを可能にします。
Vantage は、R、Python、Teradata Studio 、およびその他の SQL ベースのツールをサポートしています。Vantage は、パブリック クラウド、オンプレミス、最適化されたインフラストラクチャまたはコモディティ インフラストラクチャ、またはサービスとして導入できます。
Teradata Vantage Native Object Store (NOS) を使用すると、標準 SQL を使用して、Azure Blob Storage などの外部オブジェクト ストア内のデータを探索できます。NOS を使用するには、特別なオブジェクト ストレージ側のコンピューティング インフラストラクチャは必要ありません。コンテナを指す NOS テーブル定義を作成するだけで、Blob Storage コンテナ内のデータを探索できます。NOS を使用すると、Blob Storage からデータをすばやくインポートしたり、データベース内の他のテーブルに結合したりすることもできます。
あるいは、Teradata Parallel Transporter (TPT) ユーティリティを使用して、Blob Storage から Teradata Vantage にデータを一括インポートすることもできます。データがロードされると、Vantage 内でデータを効率的にクエリーできます。
詳細については、ドキュメントを参照してください。
前提条件
- Teradata Vantageインスタンスへのアクセス。
注記
Vantage のテストインスタンスが必要な場合は、 https://clearscape.teradata.com で無料でプロビジョニングできます
- Azure アカウント。 無料アカウントで始めることができます。
- データセットを保存するための Azure Blob Storage アカウント
手順
前提条件を満たした上で、以下の手順で行います。
- Azure Blob Storage アカウントとコンテナーを作成する
- データシェアアカウントの作成
- 共有を作成する
- データ共有を使用してデータを受信および受信する
- Blob Storage への NOS アクセスを構成する
- Blob Storageのデータセットにクエリーを実行する
- Blob StorageからVantageにデータをロードする(オプション)
Azure Blob Storageアカウントとコンテナを作成する
-
ブラウザで Azureポータル を開き(Chrome、Firefox、Safariでうまくいきます)、この記事の myProviderStorage_rg というリソースグループに ストレージアカウントを作成するの手順に従います。
-
ストレージ名と接続方法を入力します。この記事では myproviderstorage と public endpoint を使用します。
作成するすべてのサービスに同じ場所を使用することをお勧めします。
-
Review + create を選択し、Create を選択します。
-
Go to resource をクリックし、 Containers をクリックし、コンテナを作成します。
-
+ Container ボタンをクリックします。
-
コンテナ名を入力します。この記事では providerdata を使用します。
-
作成 をクリックします。
データシェアアカウントの作成
データセットを共有するプロバイダーのデータ共有アカウントを作成します。
この記事の Azure データ共有アカウントを作成する 手順に従って、 マイデータシェアプロバイダ_rg というリソース グループにリソースを作成します。
- Basics タブにデータ共有アカウント名を入力します。この記事では mydatashareprovider を使用します。
作成するすべてのサービスに同じ場所を使用することをお勧めします。
-
Review + create を選択し、Create を選択します。
-
デプロイが完了したら、Go to resource を選択します。
共有の作成
-
[データ共有]の概要ページに移動し、 共有を作成する の手順に従います。
-
Start sharing your data を選択します。
-
- Create を選択します。
-
Details タブで、共有名と共有タイプを入力します。この記事で は WeatherData と Snapshot を使用します。
受信者にデータのコピーを提供するために、スナップショット共有を選択します。
サポートされているデータストア Azure Blob Storage、Azure Data Lake Storage Gen1、Azure Data Lake Storage Gen2、Azure SQL Database、Azure Synapse Analytics (旧 SQL DW)
データへのアクセスをソースで提供するために、インプレース共有を選択します。
サポートされているデータストア Azure データエクスプローラ
-
Continue をクリックします。
-
Datasets タブで、 Add datasets をクリックします。
-
Azure Blob Storage を選択します。
-
Next をクリックします。
-
データセットを提供するストレージ アカウントを入力します。この記事では myproviderstorage を使用します。
-
*次へをクリックします。
-
コンテナをダブルクリックしてデータセットを選択します。この記事では providerdata と onpoint_history_postal-code_hour.csv ファイルを使用します。
図 6 ストレージ コンテナとデータセットの選択
Azure Data Share は、フォルダ レベルとファイル レベルで共有できます。Azure Blob Storage リソースを使用してファイルをアップロードします。
-
Next をクリックします。
-
フォルダとデータセットに対して消費者が見るデータセット名を入力します。デフォルトの名前を使用しますが、この記事では providerdata フォルダを削除します。 Add datasetsをクリックします。
-
Add datasets をクリックします。
-
Continue をクリックします。
-
Recipients タブで、 Add recipient の電子メールアドレスを追加するをクリックします。。
-
消費者の電子メールアドレスを入力します。
消費者が受け入れることができるシェア有効期限を設定します。
-
Continue をクリックします。
-
Settings タブでスナップショットのスケジュールを設定します。この記事ではデフォルトの チェックを外して を使用します。
-
Continue をクリックします。
-
Review + Create タブの Create をクリックします。
-
これでAzureデータ共有が作成され、データ共有の受信者が招待を受け入れる準備ができました。
Azure Data Share を使用したデータの受理と受信
今回は、受信者/消費者が Azure Blob ストレージ アカウントにデータを受信することを想定しています。
データ共有 プロバイダ と同様に、データ共有の招待を受け入れる前に、コンシューマ のすべての事前要件が完了していることを確認します。
- Azureのサブスクリプション。持っていない場合は、事前に +++free account+++ を作成してください。
- Azure Blob Storage アカウントとコンテナ: myConsumerStorage_rg というリソース グループを作成し、アカウント名 myconsumerstorage とコンテナ consumerdata を作成します。
- Azure Data Share アカウント: myDataShareConsumer_rg というリソース グループを作成し、 mydatashareconsumer というデータ共有アカウント名を作成して、データを受け入れます。
Azure Data Share を使用したデータの受理と受信の手順に従ってください。