Configurar una conexión a Teradata Vantage en DataHub
Información general
Este tutorial demuestra cómo crear una conexión a Teradata Vantage con DataHub e ingerir metadatos sobre tablas y vistas, junto con información de uso y linaje.
Prerrequisitos
- Acceso a una instancia de Teradata Vantage.
Nota
Si necesita una instancia de prueba de Vantage, puede obtener una de forma gratuita en https://clearscape.teradata.com
- DataHub instalado. Consulte Guía de inicio rápido de DataHub
Configurar centro de datos
- Instale el complemento Teradata para DataHub en el entorno donde tiene instalado DataHub
- Configure un usuario de Teradata y establezca privilegios para permitir que ese usuario lea las tablas del diccionario
-
Si desea ejecutar la creación de perfiles, debe otorgar permiso de selección en todas las tablas de las que desea crear perfiles.
-
Si desea extraer metadatos de linaje o uso, el registro de consultas debe estar habilitado y configurado en un tamaño que se ajuste a sus consultas (el tamaño de texto de consulta predeterminado que captura Teradata es de 200 caracteres como máximo). Un ejemplo de cómo puede configurarlo para todos los usuarios:
Agregar una conexión Teradata a DataHub
Con DataHub en ejecución, abra la GUI de DataHub e inicie sesión. En este ejemplo, se ejecuta en localhost:9002
-
Inicie el asistente de nueva conexión haciendo clic en el icono del conector de ingesta
y luego seleccionando "Crear nueva fuente"
-
Desplácese por la lista de fuentes disponibles y seleccione Otro
-
Se necesita una receta para configurar la conexión a Teradata y definir las opciones requeridas, como por ejemplo si se debe capturar el linaje de tablas y columnas, perfilar los datos o recuperar estadísticas de uso. A continuación se muestra una receta sencilla para empezar. El host, el nombre de usuario y la contraseña deben modificarse para que coincidan con su entorno.
Pegar la receta en la ventana debería verse así:
-
Haga clic en Siguiente y luego configure el programa requerido.
-
Haga clic en Siguiente para finalizar y asigne un nombre a la conexión. Haga clic en Avanzado para poder configurar la versión de CLI correcta. La compatibilidad de DataHub con Teradata empezó a estar disponible en CLI 0.12.x. Se recomienda seleccionar la versión más actual para garantizar la mejor compatibilidad.
-
Una vez guardada la nueva fuente, se puede ejecutar manualmente haciendo clic en Ejecutar.
Al hacer clic en "Exitoso" después de una ejecución exitosa, aparecerá un cuadro de diálogo similar a este donde podrá ver las bases de datos, tablas y vistas que se han incorporado a DataHub.
- Los metadatos ahora se pueden explorar en la GUI navegando:
- DataSets proporciona una lista de los conjuntos de datos (tablas y vistas) cargados
- Entidades capturadas de la base de datos
- Esquema de una entidad que muestra nombres de columnas/campos, tipos de datos y uso si se ha capturado
- Linaje que proporciona una representación visual de cómo se vinculan los datos entre tablas y vistas
Resumen
Este tutorial demostró cómo crear una conexión a Teradata Vantage con DataHub para capturar metadatos de tablas, vistas junto con estadísticas de linaje y uso.
Lectura adicional
Si tiene alguna pregunta o necesita más ayuda, visite nuestro foro de la comunidad donde podrá obtener ayuda e interactuar con otros miembros de la comunidad.