Integrar las extensiones de Teradata Jupyter con una instancia de cuaderno de SageMaker
Este tutorial le muestra cómo agregar Teradata Extensions a un entorno de Jupyter Notebooks. Hay disponible una versión alojada de Jupyter Notebooks integrada con extensiones de Teradata y herramientas de análisis, para pruebas funcionales de forma gratuita en https://clearscape.teradata.com.
Información general
Las extensiones de Teradata Jupyter proporcionan el kernel Teradata SQL y varias extensiones de interfaz de usuario para permitir a los usuarios acceder y navegar fácilmente por la base de datos de Teradata desde el entorno Jupyter. Este artículo describe cómo integrar nuestras extensiones de Jupyter con la instancia del cuaderno de SageMaker.
Prerrequisitos
- Acceso a una instancia de Teradata Vantage
Nota
Si necesita una instancia de prueba de Vantage, puede obtener una de forma gratuita en https://clearscape.teradata.com
- Cuenta de AWS
- Depósito de AWS S3 para almacenar scripts de configuración del ciclo de vida y paquete de extensiones de Teradata Jupyter
Integración
SageMaker admite la personalización de instancias de cuadernos mediante scripts de configuración del ciclo de vida. A continuación, mostraremos cómo usar scripts de configuración del ciclo de vida para instalar nuestro kernel y extensiones de Jupyter en una instancia de cuaderno.
Pasos para integrar con la instancia de cuaderno
- Descargar el paquete de extensiones Jupyter de Teradata
Descargue la versión de Linux desde https://downloads.teradata.com/download/tools/vantage-modules-for-jupyter y cárguela en un depósito de S3. Este paquete comprimido contiene el kernel y las extensiones de Teradata Jupyter. Cada extensión tiene 2 archivos, el que tiene "prebuilt" en el nombre es una extensión prediseñada que se puede instalar usando PIP, el otro es una extensión fuente que debe instalarse usando "jupyter labextension". Se recomienda utilizar extensiones prediseñadas.
- Cree una configuración de ciclo de vida para la instancia de cuaderno.
A continuación se muestran scripts de ejemplo que obtienen el paquete Teradata del depósito S3 e instalan el kernel y las extensiones de Jupyter. Tenga en cuenta que on-create.sh crea un entorno conda personalizado que persiste en el volumen EBS de la instancia de cuaderno para que la instalación no se pierda después de reiniciar el cuaderno. on-start.sh instala el kernel de Teradata y las extensiones en el entorno conda personalizado.
on-create.sh
on-start.sh
-
Cree una instancia de cuaderno. Seleccione 'Amazon Linux 2, Jupyter Lab3' para el identificador de plataforma y seleccione la configuración del ciclo de vida creada en el paso 2 para la configuración del ciclo de vida.
Es posible que también necesite agregar vpc, subred y grupo de seguridad en la sección 'Red' para obtener acceso a las bases de datos de Teradata.
-
Espere hasta que el estado de la instancia de cuaderno cambie a "InService", haga clic en "Abrir JupyterLab" para abrir el cuaderno.
Acceda a los cuadernos de demostración para obtener consejos de uso
Lectura adicional
- Sitio web de extensiones de Jupyter de Teradata
- Guía de instalación de módulos Teradata Vantage™ para Jupyter
- Guía del usuario del paquete Teradata® para Python
- Personalizar una instancia de cuaderno mediante un script de configuración del ciclo de vida
- Ejemplos de configuración del ciclo de vida de la instancia de cuaderno de Amazon Sagemaker
Si tiene alguna pregunta o necesita más ayuda, visite nuestro foro de la comunidad donde podrá obtener ayuda e interactuar con otros miembros de la comunidad.