Zum Hauptinhalt springen

Installieren Sie den Manager auf AWS

Bevor Sie beginnen, stellen Sie sicher, dass Sie über die Voraussetzungen verfügen und Ihr AWS-Konto die Anforderungen erfüllt.

Der AI Unlimited Manager orchestriert die Bereitstellung der Engine und umfasst eine webbasierte Benutzeroberfläche für die Einrichtung.

Sie verwenden eine von Teradata bereitgestellte CloudFormation-Vorlage, um den Manager über die AWS Management Console zu installieren. Sie stellen eine Serverinstanz bereit, auf der der Manager in einem von systemd gesteuerten Container ausgeführt wird.

Tipp

Wenn Sie Hilfe bei der Installation benötigen, senden Sie eine E-Mail an das Support-Team oder fragen Sie die Gemeinschaft.

Klonen des Repository

Der Ordner Bereitstellungen im von Teradata bereitgestellten AI Unlimited GitHub-Repository enthält Vorlagen-, Parameter- und Richtliniendateien für die Installation von AI Unlimited.

Öffnen Sie ein Terminalfenster und klonen Sie das Repository.

Suchen Sie nach der Managervorlage

CloudFormation-Vorlagen für den Manager finden Sie hier im AI Unlimited GitHub-Repository:

deployments/aws/templates/ai-unlimited/

Wählen Sie eine Vorlage basierend darauf aus, ob und welchen Typ Sie einen Lastausgleich verwenden möchten.

Hinweis

Möglicherweise möchten Sie einen Cloud-Administrator in Ihrer Organisation um Rat fragen.

  • ai-unlimited-with-alb.yaml – Hostet den Manager hinter einem application load balancer
  • ai-unlimited-with-nlb.yaml – Hostet den Manager hinter einem network load balancer
  • ai-unlimited-without-lb.yaml – Kein Lastausgleich. Wenn Sie sich nicht sicher sind, welche Vorlage Sie verwenden sollen, empfehlen wir diese.

Laden Sie die Vorlage

  1. Melden Sie sich bei der AWS-Konsole an.
    Hinweis

    Verweise auf die AWS Management Console sind auf dem Stand vom 29. Mai 2024.

  2. Wählen Sie die AWS-Region aus, in der AI Unlimited bereitgestellt werden soll.
    Wir empfehlen, die Region auszuwählen, die Ihrem primären Arbeitsort am nächsten liegt.
  3. Starten Sie einen entsprechenden Suchvorgang und gehen Sie zu CloudFormation.
  4. Wählen Sie Stapel erstellenund dann Mit neuen Ressourcen (Standard).
  5. Wählen Sie Eine vorhandene Vorlage auswählen und dann Eine Vorlagendatei hochladen.
  6. Wählen Sie die gewünschte Vorlagendatei aus und klicken Sie auf Weiter.

Geben Sie Stapeldetails und -optionen an

  1. Geben Sie einen Stapelnamen an.
  2. Überprüfen Sie die Parameter. Geben Sie Werte für die erforderlichen Parameter ein. Ihre Organisation benötigt möglicherweise andere.
AWS- und Manager-Parameter

Die Parameter für jede Vorlage sind unterschiedlich. Möglicherweise werden hier einige Parameter angezeigt, die in der Konsole nicht angezeigt werden.

ParameterBeschreibungHinweise
Stack nameDie Kennung, mit der Sie den AI Unlimited-Stapel in einer Stapelliste finden können.Erforderlich
Standard: NA
Der Name darf nur alphanumerische Zeichen (Groß-/Kleinschreibung beachten) und Bindestriche enthalten. Er muss mit einem alphabetischen Zeichen beginnen und darf nicht länger als 128 Zeichen sein.
AiUnlimitedNameDer Name der AI Unlimited-Instanz.Erforderlich mit Standard
Standard: ai-unlimited
Der Name darf nur alphanumerische Zeichen (Groß-/Kleinschreibung beachten) und Bindestriche enthalten. Er muss mit einem alphabetischen Zeichen beginnen und darf nicht länger als 20 Zeichen sein.
InstanceTypeDer EC2-Instanztyp für den Manager.Erforderlich mit Standard
Standard: t3.micro
WICHTIG: Wenn die Instanz nicht die richtige Größe hat, können Fehler beim Bereitstellen und Anhalten der Engine auftreten und Sie müssen den Manager auf einer größeren Instanz neu installieren. Siehe Mehr erfahren: Empfehlungen zum Manager-Instanztyp (Größe) unter dem Abschnitt „Parameter“.
RootVolumeSizeDie Größe der Root-Festplatte in GB, die Sie an die Instanz anhängen möchten.Erforderlich mit Standard
Standard: 20
Unterstützt Werte zwischen 8 und 1000.
TerminationProtectionAktiviert den Instanzbeendigungsschutz.Erforderlich mit Standard
Standard: false
IamRoleGibt an, ob CloudFormation eine neue IAM-Rolle erstellen oder eine vorhandene verwenden soll.Erforderlich mit Standard
Standard: New
Unterstützte Optionen sind: „Neu“ oder „Vorhanden“
IamRoleNameDer Name der IAM-Rolle, die der Instanz zugewiesen werden soll, entweder eine vorhandene oder eine neu erstellte IAM-Rolle.Optional mit Standard
Standard: ai-unlimited-iam-role
Beim Benennen einer neuen IAM-Rolle erfordert CloudFormation die Funktion CAPABILITY_NAMED_IAM. Lassen Sie dieses Feld leer, um einen automatisch generierten Namen zu verwenden.
IamPermissionsBoundaryDie ARN der IAM-Berechtigungsgrenze, die der der Instanz zugewiesenen IAM-Rolle zugeordnet werden soll.Optional
Standard: NA
AvailabilityZoneDie Verfügbarkeitszone, in der Sie die Instanz bereitstellen möchten.Erforderlich
Standard: NA
Der Wert muss mit dem Subnetz und der Zone aller bereits vorhandenen Volumes übereinstimmen und der Instanztyp muss in der ausgewählten Zone verfügbar sein.
LoadBalancerSchemeWenn ein Lastausgleich verwendet wird, gibt dieses Feld an, ob auf die Instanz über das Internet oder nur innerhalb der VPC zugegriffen werden kann.Optional mit Standard
Standard: Internet-facing
Der DNS-Name eines internetseitigen Lastausgleichs ist öffentlich auflösbar in die öffentlichen IP-Adressen der Knoten. Daher können internetseitige Lastausgleichsanfragen von Clients über das Internet weiterleiten.
Die Knoten eines internen Lastausgleichs haben nur private IP-Adressen. Der DNS-Name eines internen Lastausgleich ist öffentlich auflösbar in die persönlichen IP-Adressen der Knoten. Daher können interne Lastausgleichsanfragen von Clients mit Zugriff auf die VPC für den Lastausgleich weiterleiten.
LoadBalancerSubnetOneDas Subnetz, in dem der Lastausgleich gehostet wird. Das Subnetz bestimmt die Verfügbarkeitszonen, IP-Adressen und Endpunkte des Lastausgleichs.Optional mit Standard
Standard: NA
Sie müssen mindestens ein verfügbares Subnetz definieren, um einen Network Load Balancer (NLB) und zwei Subnetze für einen Application Load Balancer (ALB) zu erstellen.
LoadBalancerSubnetTwoDas Subnetz, in dem der Lastausgleich gehostet wird.Optional. Diese Option ist nur in der Vorlage mit ALB verfügbar.
Standard: NA
HostedZoneIDDie ID, die Amazon Route 53 der gehosteten Zone beim Erstellen zugewiesen hat.Optional
Standard: NA
Jede gehostete Zone entspricht einem Domänennamen oder möglicherweise einer Subdomäne. Die gehostete Zone ist der Container für DNS-Einträge, in dem Sie konfigurieren, wie die Welt mit Ihrer Domäne interagiert, z. B. indem Sie sie mit einem Eintrag auf eine IP-Adresse verweisen.
Gehen Sie in der AWS-Konsole zu Route 53 > Gehostete Zonen. Suchen Sie Ihren registrierten Domänennamen und die entsprechende gehostete Zonen-ID.
DnsNameDer Name der Domäne. Bei öffentlich gehosteten Zonen ist dies der Name, den Sie bei Ihrem DNS-Registrar registriert haben.Optional
Standard: NA
Informationen zum Angeben anderer Zeichen als az, 0-9 und - (Bindestrich) und zum Angeben internationalisierter Domänennamen finden Sie unter Gehostete Zone erstellen.
PrivateGibt an, ob der Dienst in einem privaten Netzwerk ohne öffentliche IPs bereitgestellt wird.Erforderlich
Standard: false
Stellen Sie sicher, dass Sie die Option „Automatische Zuweisung öffentlicher IPv4-Adressen aktivieren“ im Subnetz auswählen, in dem sich der Manager befindet. Wenn diese Option nicht ausgewählt ist, kann die Installation fehlschlagen.
SessionGibt an, ob Sie den AWS Session Manager für den Zugriff auf die Instanz verwenden können.Erforderlich
Standard: false
VpcDas Netzwerk, in dem Sie die Instanz bereitstellen möchten.Erforderlich
Standard: NA
SubnetDas Subnetz, in dem Sie die Instanz bereitstellen möchten.Erforderlich
Standard: NA
Das Subnetz muss sich in der ausgewählten Verfügbarkeitszone befinden.
KeyNameDas öffentliche/private Schlüsselpaar, mit dem Sie nach dem Start eine sichere Verbindung zu Ihrer Instanz herstellen können. Wenn Sie ein AWS-Konto erstellen, ist dies das Schlüsselpaar, das Sie in Ihrer bevorzugten Region erstellen.Optional
Standard: NA
Lassen Sie dieses Feld leer, wenn Sie die SSH-Schlüssel nicht einschließen möchten.
AccessCIDRDer CIDR-IP-Adressbereich, der auf die Instanz zugreifen darf.Optional
Standard: NA
Wir empfehlen, diesen Wert auf einen vertrauenswürdigen IP-Bereich festzulegen. Definieren Sie mindestens eine der Optionen „AccessCIDR“, „PrefixList“ oder „SecurityGroup“, um eingehenden Datenverkehr zuzulassen, sofern Sie keine benutzerdefinierten Eingangsregeln für Sicherheitsgruppen erstellen.
PrefixListDie PrefixList, die Sie zur Kommunikation mit der Instanz verwenden können. Es handelt sich um eine Sammlung von CIDR-Blöcken, die eine Reihe von IP-Adressbereichen definieren, für die dieselbe Richtliniendurchsetzung erforderlich ist.Optional
Standard: NA
Definieren Sie mindestens eine der Optionen AccessCIDR, PrefixList oder SecurityGroup, um eingehenden Datenverkehr zuzulassen, sofern Sie keine benutzerdefinierten Regeln für den eingehenden Datenverkehr für Sicherheitsgruppen erstellen. Achten Sie darauf, den Namen der PrefixList und nicht die ID einzugeben.
SecurityGroupDie virtuelle Firewall, die den ein- und ausgehenden Datenverkehr zur Instanz kontrolliert.Optional
Standard: NA
Implementiert als Regelsatz, der angibt, welche Protokolle, Ports und IP-Adressen oder CIDR-Blöcke auf die Instanz zugreifen dürfen. Definieren Sie mindestens eines von AccessCIDR, PrefixList oder SecurityGroup, um eingehenden Datenverkehr zuzulassen, sofern Sie keine benutzerdefinierten Eingangsregeln für Sicherheitsgruppen erstellen.
AIUnlimitedHttpPortDer Port für den Zugriff auf die AI Unlimited-Benutzeroberfläche.Erforderlich mit Standard
Standard: 3000
AIUnlimitedGrpcPortDer Port für den Zugriff auf die AI Unlimited API.Erforderlich mit Standard
Standard: 3282
AIUnlimitedVersionDie Version von AI Unlimited, die Sie bereitstellen möchten.Erforderlich mit Standard
Standard: latest
Der Wert ist ein Container-Versionstag.
UsePersistentVolumeGibt an, ob Sie zum Speichern von Daten ein neues oder vorhandenes persistentes Volume verwenden möchten. Weitere Informationen finden Sie unter Mehr erfahren: Persistentes Volume verwenden unter dem Parameterabschnitt.Optional mit Standard
Standard: New
Unterstützte Optionen sind je nach Anwendungsfall ein neues oder ein vorhandenes dauerhaftes Volume.
PersistentVolumeSizeDie Größe des persistenten Datenträgers, den Sie an die Instanz anhängen, in GB.Erforderlich mit Standard
Standard: 20
Unterstützt Werte zwischen 8 und 1000.
ExistingPersistentVolumeIdDie ID des vorhandenen persistenten Datenträgers, den Sie an die Instanz anhängen.Erforderlich, wenn UsePersistentVolume auf Vorhanden gesetzt ist.
Standard: NA
Das persistente Volume muss sich in derselben Verfügbarkeitszone wie die AI Unlimited-Instanz befinden.
PersistentVolume
DeletionPolicy
Das persistente Volume-Verhalten, wenn Sie die CloudFormation-Bereitstellung löschen.Erforderlich mit Standard
LatestAmiIdDie ID des Images, das auf die neueste AMI-Version verweist. Dieser Wert wird für die SSM-Suche verwendet.Erforderlich mit Standard
Standard: NA
Diese Bereitstellung verwendet das neueste verfügbare Image ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2.
WICHTIG: Das Ändern dieses Wertes kann den Stapel beschädigen.
Mehr erfahren: Empfehlungen zum Manager-Instanztyp (Größe)

Für die kostenpflichtige öffentliche Vorschau von AI Unlimited empfehlen wir diese T3-Instanztypen, basierend auf der Anzahl gleichzeitiger Bereitstellungs- und Suspendierungsvorgänge der Engine. Die Leistung der anderen verfügbaren Instanztypen kann variieren.

InstanztypGleichzeitige Vorgänge
t3.micro1
t3.smallbis zu 5
t3.mediumbis zu 10
t3.largebis zu 20
t3.xlargemehr als 21

Die Parallelität wird zunehmen, wenn AI Unlimited zur allgemeinen Verfügbarkeit freigegeben wird.

Mehr erfahren: Persistentes Volume verwenden

Die Managerinstanz wird in einem Container ausgeführt und speichert ihre Konfigurationsdaten in einer Datenbank im Stammdatenträger der Instanz. Diese Daten bleiben erhalten, wenn Sie die Instanz herunterfahren, neu starten oder einen Snapshot erstellen und neu starten.

Ein persistentes Volume speichert Daten für eine containerisierte Anwendung über die Lebensdauer des Containers, Pods oder Knotens hinaus, in dem sie ausgeführt wird.

Ohne ein persistentes Volumen

Wenn der Container, Pod oder Knoten abstürzt oder beendet wird, gehen die Konfigurationsdaten des Managers verloren. Sie können eine neue Managerinstanz bereitstellen, jedoch nicht im selben Zustand wie die verlorene.

Mit einem persistenten Volumen

Wenn der Container, der Pod oder der Knoten abstürzt oder beendet wird und die Konfigurationsdaten des Managers in einem persistenten Volume gespeichert sind, können Sie eine neue Managerinstanz bereitstellen, die dieselbe Konfiguration wie die verlorene hat.

Beispiel

  1. Stellen Sie den Manager bereit und schließen Sie diese Parameter ein:
    • UsePersistentVolume: New
    • PersistentVolumeDeletionPolicy: Retain
  2. Nachdem Sie den Stapel erstellt haben, notieren Sie sich auf der Registerkarte Ausgaben die „volume-id“.
  3. Nutzen Sie AI Unlimited.
  4. Wenn die Managerinstanz verloren geht, stellen Sie den Manager erneut bereit und schließen Sie diese Parameter ein:
    • UsePersistentVolume: New
    • PersistentVolumeDeletionPolicy: Retain
    • ExistingPersistentVolumeId: der Wert, den Sie in Schritt 2 notiert haben

Die neue Managerinstanz hat die gleiche Konfiguration wie die verlorene.

  1. Wählen Sie Weiter.
  2. Konfigurieren Sie die Stapeloptionen entsprechend Ihren Anforderungen und wählen Sie dann Weiteraus.

Überprüfen und Erstellen des Stapels

  1. Überprüfen Sie die Vorlageneinstellungen.
  2. Aktivieren Sie das Kontrollkästchen, um zu bestätigen, dass die Vorlage IAM-Ressourcen erstellen wird.
  3. Wählen Sie Übermitteln, um den Stapel bereitzustellen.
    Auf der Registerkarte Ereignisse können Sie den Fortschritt überwachen. Wenn der Status aller Ressourcen CREATE_COMPLETE lautet, ist der Manager bereit.

Die Registerkarte Ausgaben zeigt die für die erstellten Ressourcen generierten Werte.

Sie benötigen die URL, um auf den Manager zuzugreifen und AI Unlimited einzurichten.

Wie geht es weiter?

Erstellen Sie eine OAuth-App, um die Authentifizierung zwischen AI Unlimited und Ihrem Git-Provider-Konto zu ermöglichen.

Auch interessant