Saltar al contenido principal

Integrar las extensiones de Teradata Jupyter con una instancia de cuaderno de SageMaker

Nota

Este tutorial le muestra cómo agregar Teradata Extensions a un entorno de Jupyter Notebooks. Hay disponible una versión alojada de Jupyter Notebooks integrada con extensiones de Teradata y herramientas de análisis, para pruebas funcionales de forma gratuita en https://clearscape.teradata.com.

Información general

Las extensiones de Teradata Jupyter proporcionan el kernel Teradata SQL y varias extensiones de interfaz de usuario para permitir a los usuarios acceder y navegar fácilmente por la base de datos de Teradata desde el entorno Jupyter. Este artículo describe cómo integrar nuestras extensiones de Jupyter con la instancia del cuaderno de SageMaker.

Prerrequisitos

  • Acceso a una instancia de Teradata Vantage
    Nota

    Si necesita una instancia de prueba de Vantage, puede obtener una de forma gratuita en https://clearscape.teradata.com

  • Cuenta de AWS
  • Depósito de AWS S3 para almacenar scripts de configuración del ciclo de vida y paquete de extensiones de Teradata Jupyter

Integración

SageMaker admite la personalización de instancias de cuadernos mediante scripts de configuración del ciclo de vida. A continuación, mostraremos cómo usar scripts de configuración del ciclo de vida para instalar nuestro kernel y extensiones de Jupyter en una instancia de cuaderno.

Pasos para integrar con la instancia de cuaderno

  1. Descargar el paquete de extensiones Jupyter de Teradata

Descargue la versión de Linux desde https://downloads.teradata.com/download/tools/vantage-modules-for-jupyter y cárguela en un depósito de S3. Este paquete comprimido contiene el kernel y las extensiones de Teradata Jupyter. Cada extensión tiene 2 archivos, el que tiene "prebuilt" en el nombre es una extensión prediseñada que se puede instalar usando PIP, el otro es una extensión fuente que debe instalarse usando "jupyter labextension". Se recomienda utilizar extensiones prediseñadas.

  1. Cree una configuración de ciclo de vida para la instancia de cuaderno. crear una configuración de ciclo de vida para la instancia de cuaderno

A continuación se muestran scripts de ejemplo que obtienen el paquete Teradata del depósito S3 e instalan el kernel y las extensiones de Jupyter. Tenga en cuenta que on-create.sh crea un entorno conda personalizado que persiste en el volumen EBS de la instancia de cuaderno para que la instalación no se pierda después de reiniciar el cuaderno. on-start.sh instala el kernel de Teradata y las extensiones en el entorno conda personalizado.

on-create.sh

on-start.sh

  1. Cree una instancia de cuaderno. Seleccione 'Amazon Linux 2, Jupyter Lab3' para el identificador de plataforma y seleccione la configuración del ciclo de vida creada en el paso 2 para la configuración del ciclo de vida.

    Crear una instancia de notebook

Es posible que también necesite agregar vpc, subred y grupo de seguridad en la sección 'Red' para obtener acceso a las bases de datos de Teradata.

  1. Espere hasta que el estado de la instancia de cuaderno cambie a "InService", haga clic en "Abrir JupyterLab" para abrir el cuaderno. Open notebook

    Acceda a los cuadernos de demostración para obtener consejos de uso access demo notebooks

Lectura adicional

Nota

Si tiene alguna pregunta o necesita más ayuda, visite nuestro foro de la comunidad donde podrá obtener ayuda e interactuar con otros miembros de la comunidad.

También de interés