Ejecutar demostraciones de Teradata Jupyter Notebook para VantageCloud Lake en Google Cloud Vertex AI
Información general
En este inicio rápido se explica cómo ejecutar Demostraciones de Jupyter Notebook de Teradata para VantageCloud Lake en Vertex AI, la plataforma IA/ML para Google Cloud.
Prerrequisitos
- Módulos de Teradata para Jupyter versión de escritorio para Linux (descarga de la aquí, es necesario registrarse)
- Cuenta de Google Cloud con API de Notebooks y Vertex AI habilitada
- Almacenamiento en Google Cloud para almacenar scripts de inicio y el paquete de extensiones de Teradata Jupyter
- Acceso a un entorno VantageCloud Lake
Configuración del entorno Vertex AI Google Cloud
Cuando crea una nueva instancia de cuaderno, puede especificar un script de inicio. Este script, que se ejecuta solo una vez después de la creación de la instancia, instalará el paquete de extensiones de Teradata Jupyter y clonará un repositorio de GitHub en la nueva instancia de notebooks administrada por el usuario.
-
Descargar el paquete de extensiones Jupyter de Teradata
- Visite página de módulos Vantage para Jupyter
- Inicie sesión y descargue la versión Teradata Linux del paquete.
-
Crear depósito de almacenamiento en Google Cloud
- Cree un depósito con un nombre relevante para el proyecto (por ejemplo, teradata_jupyter).
- Asegúrese de que el nombre del depósito sea globalmente único. Por ejemplo, si el nombre teradata_jupyter ya se ha utilizado, no estará disponible para usuarios posteriores.
-
Cargue el paquete de extensiones de Jupyter descomprimido en su depósito de Google Cloud Storage como un archivo.
-
Escriba el siguiente script de inicio y guárdelo como
startup.sh
en su máquina local.
A continuación se muestra un script de ejemplo que recupera el paquete de extensiones de Teradata Jupyter del depósito de Google Cloud Storage e instala el kernel de Teradata SQL, las extensiones y clona el repositorio lake-demos.
Recuerde reemplazar teradata_jupyter en el comando gsutil cp.
- Suba este script a su depósito de almacenamiento de Google Cloud como un archivo
Iniciar una instancia de cuaderno administrada por el usuario
-
Acceda a Vertex AI Workbench
- Regrese a Vertex AI Workbench en la consola de Google Cloud.
- Cree una nueva libreta administrada por el usuario a través de Opciones avanzadas o directamente en https://notebook.new/.
-
En Detalles, asigne un nombre a su cuaderno, seleccione su región y seleccione continuar.
-
En Entorno, seleccione Examinar para seleccionar su script startup.sh de su depósito de Google Cloud.
-
Seleccione Crear para iniciar el cuaderno. Es posible que el proceso de creación del cuaderno tarde unos minutos en completarse. Cuando termine, haga clic en OPEN JUPYTERLAB.
Tendrá que incluir esta IP en la lista blanca en su entorno VantageCloud Lake para permitir la conexión. Esta solución es apropiada en un entorno de prueba. Para entornos de producción, es posible que sea necesario configurar e incluir en la lista blanca una configuración de VPC, subredes y grupos de seguridad.
- En JupyterLab, abra un cuaderno con un kernel de Python y ejecute el siguiente comando para encontrar la dirección IP de la instancia del cuaderno.
Configuración de VantageCloud Lake
- En el entorno VantageCloud Lake, en configuración, agregue la IP de su instancia de notebook
Editar vars.json
Navegue hasta el directorio lake-demos
en su cuaderno.
Haga clic derecho en vars.json para abrir el archivo con el editor.
Edite el archivo archivo vars.json para incluir las credenciales necesarias para ejecutar las demostraciones
Variable | Valor |
---|---|
"host" | Valor de IP pública de su entorno VantageCloud Lake |
"UES_URI" | Análisis abierto desde su entorno VantageCloud Lake |
"dbc" | La contraseña maestra de su entorno VantageCloud Lake. |
Para recuperar una dirección IP pública y un punto de conexión de Open Analytics, siga estos instrucciones.
Cambie las contraseñas en el archivo vars.json. Verá que en el archivo vars.json de muestra, las contraseñas de todos los usuarios están predeterminadas en "password", esto es solo para cuestiones del archivo de muestra, debe cambiar todas estas contraseñas. campos a contraseñas seguras, protéjalas según sea necesario y siga otras mejores prácticas de administración de contraseñas
Ejecutar demostraciones
Ejecute todas las celdas de 0_Demo_Environment_Setup.ipynb para configurar su entorno. Seguido de 1_Demo_Setup_Base_Data.ipynb para cargar los datos base necesarios para la demostración.
Para obtener más información sobre los cuadernos de demostración, vaya a la página Demostraciones de Teradata Lake en GitHub.
Resumen
En este inicio rápido hemos configurado Google Cloud Vertex AI Workbench Notebooks para ejecutar Demostraciones de Jupyter Notebook de Teradata para VantageCloud Lake.