Installieren Sie den Manager auf AWS
Bevor Sie beginnen, stellen Sie sicher, dass Sie über die Voraussetzungen verfügen und Ihr AWS-Konto die Anforderungen erfüllt.
Der AI Unlimited Manager orchestriert die Bereitstellung der Engine und umfasst eine webbasierte Benutzeroberfläche für die Einrichtung.
Sie verwenden eine von Teradata bereitgestellte CloudFormation-Vorlage, um den Manager über die AWS Management Console zu installieren. Sie stellen eine Serverinstanz bereit, auf der der Manager in einem von systemd gesteuerten Container ausgeführt wird.
Wenn Sie Hilfe bei der Installation benötigen, senden Sie eine E-Mail an das Support-Team oder fragen Sie die Gemeinschaft.
Klonen des Repository
Der Ordner Bereitstellungen
im von Teradata bereitgestellten AI Unlimited GitHub-Repository enthält Vorlagen-, Parameter- und Richtliniendateien für die Installation von AI Unlimited.
Öffnen Sie ein Terminalfenster und klonen Sie das Repository.
Suchen Sie nach der Managervorlage
CloudFormation-Vorlagen für den Manager finden Sie hier im AI Unlimited GitHub-Repository:
deployments/aws/templates/ai-unlimited/
Wählen Sie eine Vorlage basierend darauf aus, ob und welchen Typ Sie einen Lastausgleich verwenden möchten.
Möglicherweise möchten Sie einen Cloud-Administrator in Ihrer Organisation um Rat fragen.
ai-unlimited-with-alb.yaml
– Hostet den Manager hinter einem application load balancerai-unlimited-with-nlb.yaml
– Hostet den Manager hinter einem network load balancerai-unlimited-without-lb.yaml
– Kein Lastausgleich. Wenn Sie sich nicht sicher sind, welche Vorlage Sie verwenden sollen, empfehlen wir diese.
Laden Sie die Vorlage
- Melden Sie sich bei der AWS-Konsole an.
HinweisVerweise auf die AWS Management Console sind auf dem Stand vom 29. Mai 2024.
- Wählen Sie die AWS-Region aus, in der AI Unlimited bereitgestellt werden soll.
Wir empfehlen, die Region auszuwählen, die Ihrem primären Arbeitsort am nächsten liegt. - Starten Sie einen entsprechenden Suchvorgang und gehen Sie zu CloudFormation.
- Wählen Sie Stapel erstellenund dann Mit neuen Ressourcen (Standard).
- Wählen Sie Eine vorhandene Vorlage auswählen und dann Eine Vorlagendatei hochladen.
- Wählen Sie die gewünschte Vorlagendatei aus und klicken Sie auf Weiter.
Geben Sie Stapeldetails und -optionen an
- Geben Sie einen Stapelnamen an.
- Überprüfen Sie die Parameter. Geben Sie Werte für die erforderlichen Parameter ein. Ihre Organisation benötigt möglicherweise andere.
AWS- und Manager-Parameter
Die Parameter für jede Vorlage sind unterschiedlich. Möglicherweise werden hier einige Parameter angezeigt, die in der Konsole nicht angezeigt werden.
Parameter | Beschreibung | Hinweise |
---|---|---|
Stack name | Die Kennung, mit der Sie den AI Unlimited-Stapel in einer Stapelliste finden können. | Erforderlich Standard: NA Der Name darf nur alphanumerische Zeichen (Groß-/Kleinschreibung beachten) und Bindestriche enthalten. Er muss mit einem alphabetischen Zeichen beginnen und darf nicht länger als 128 Zeichen sein. |
AiUnlimitedName | Der Name der AI Unlimited-Instanz. | Erforderlich mit Standard Standard: ai-unlimited Der Name darf nur alphanumerische Zeichen (Groß-/Kleinschreibung beachten) und Bindestriche enthalten. Er muss mit einem alphabetischen Zeichen beginnen und darf nicht länger als 20 Zeichen sein. |
InstanceType | Der EC2-Instanztyp für den Manager. | Erforderlich mit Standard Standard: t3.micro WICHTIG: Wenn die Instanz nicht die richtige Größe hat, können Fehler beim Bereitstellen und Anhalten der Engine auftreten und Sie müssen den Manager auf einer größeren Instanz neu installieren. Siehe Mehr erfahren: Empfehlungen zum Manager-Instanztyp (Größe) unter dem Abschnitt „Parameter“. |
RootVolumeSize | Die Größe der Root-Festplatte in GB, die Sie an die Instanz anhängen möchten. | Erforderlich mit Standard Standard: 20 Unterstützt Werte zwischen 8 und 1000. |
TerminationProtection | Aktiviert den Instanzbeendigungsschutz. | Erforderlich mit Standard Standard: false |
IamRole | Gibt an, ob CloudFormation eine neue IAM-Rolle erstellen oder eine vorhandene verwenden soll. | Erforderlich mit Standard Standard: New Unterstützte Optionen sind: „Neu“ oder „Vorhanden“ |
IamRoleName | Der Name der IAM-Rolle, die der Instanz zugewiesen werden soll, entweder eine vorhandene oder eine neu erstellte IAM-Rolle. | Optional mit Standard Standard: ai-unlimited-iam-role Beim Benennen einer neuen IAM-Rolle erfordert CloudFormation die Funktion CAPABILITY_NAMED_IAM. Lassen Sie dieses Feld leer, um einen automatisch generierten Namen zu verwenden. |
IamPermissionsBoundary | Die ARN der IAM-Berechtigungsgrenze, die der der Instanz zugewiesenen IAM-Rolle zugeordnet werden soll. | Optional Standard: NA |
AvailabilityZone | Die Verfügbarkeitszone, in der Sie die Instanz bereitstellen möchten. | Erforderlich Standard: NA Der Wert muss mit dem Subnetz und der Zone aller bereits vorhandenen Volumes übereinstimmen und der Instanztyp muss in der ausgewählten Zone verfügbar sein. |
LoadBalancerScheme | Wenn ein Lastausgleich verwendet wird, gibt dieses Feld an, ob auf die Instanz über das Internet oder nur innerhalb der VPC zugegriffen werden kann. | Optional mit Standard Standard: Internet-facing Der DNS-Name eines internetseitigen Lastausgleichs ist öffentlich auflösbar in die öffentlichen IP-Adressen der Knoten. Daher können internetseitige Lastausgleichsanfragen von Clients über das Internet weiterleiten. Die Knoten eines internen Lastausgleichs haben nur private IP-Adressen. Der DNS-Name eines internen Lastausgleich ist öffentlich auflösbar in die persönlichen IP-Adressen der Knoten. Daher können interne Lastausgleichsanfragen von Clients mit Zugriff auf die VPC für den Lastausgleich weiterleiten. |
LoadBalancerSubnetOne | Das Subnetz, in dem der Lastausgleich gehostet wird. Das Subnetz bestimmt die Verfügbarkeitszonen, IP-Adressen und Endpunkte des Lastausgleichs. | Optional mit Standard Standard: NA Sie müssen mindestens ein verfügbares Subnetz definieren, um einen Network Load Balancer (NLB) und zwei Subnetze für einen Application Load Balancer (ALB) zu erstellen. |
LoadBalancerSubnetTwo | Das Subnetz, in dem der Lastausgleich gehostet wird. | Optional. Diese Option ist nur in der Vorlage mit ALB verfügbar. Standard: NA |
HostedZoneID | Die ID, die Amazon Route 53 der gehosteten Zone beim Erstellen zugewiesen hat. | Optional Standard: NA Jede gehostete Zone entspricht einem Domänennamen oder möglicherweise einer Subdomäne. Die gehostete Zone ist der Container für DNS-Einträge, in dem Sie konfigurieren, wie die Welt mit Ihrer Domäne interagiert, z. B. indem Sie sie mit einem Eintrag auf eine IP-Adresse verweisen. Gehen Sie in der AWS-Konsole zu Route 53 > Gehostete Zonen. Suchen Sie Ihren registrierten Domänennamen und die entsprechende gehostete Zonen-ID. |
DnsName | Der Name der Domäne. Bei öffentlich gehosteten Zonen ist dies der Name, den Sie bei Ihrem DNS-Registrar registriert haben. | Optional Standard: NA Informationen zum Angeben anderer Zeichen als az, 0-9 und - (Bindestrich) und zum Angeben internationalisierter Domänennamen finden Sie unter Gehostete Zone erstellen. |
Private | Gibt an, ob der Dienst in einem privaten Netzwerk ohne öffentliche IPs bereitgestellt wird. | Erforderlich Standard: false Stellen Sie sicher, dass Sie die Option „Automatische Zuweisung öffentlicher IPv4-Adressen aktivieren“ im Subnetz auswählen, in dem sich der Manager befindet. Wenn diese Option nicht ausgewählt ist, kann die Installation fehlschlagen. |
Session | Gibt an, ob Sie den AWS Session Manager für den Zugriff auf die Instanz verwenden können. | Erforderlich Standard: false |
Vpc | Das Netzwerk, in dem Sie die Instanz bereitstellen möchten. | Erforderlich Standard: NA |
Subnet | Das Subnetz, in dem Sie die Instanz bereitstellen möchten. | Erforderlich Standard: NA Das Subnetz muss sich in der ausgewählten Verfügbarkeitszone befinden. |
KeyName | Das öffentliche/private Schlüsselpaar, mit dem Sie nach dem Start eine sichere Verbindung zu Ihrer Instanz herstellen können. Wenn Sie ein AWS-Konto erstellen, ist dies das Schlüsselpaar, das Sie in Ihrer bevorzugten Region erstellen. | Optional Standard: NA Lassen Sie dieses Feld leer, wenn Sie die SSH-Schlüssel nicht einschließen möchten. |
AccessCIDR | Der CIDR-IP-Adressbereich, der auf die Instanz zugreifen darf. | Optional Standard: NA Wir empfehlen, diesen Wert auf einen vertrauenswürdigen IP-Bereich festzulegen. Definieren Sie mindestens eine der Optionen „AccessCIDR“, „PrefixList“ oder „SecurityGroup“, um eingehenden Datenverkehr zuzulassen, sofern Sie keine benutzerdefinierten Eingangsregeln für Sicherheitsgruppen erstellen. |
PrefixList | Die PrefixList, die Sie zur Kommunikation mit der Instanz verwenden können. Es handelt sich um eine Sammlung von CIDR-Blöcken, die eine Reihe von IP-Adressbereichen definieren, für die dieselbe Richtliniendurchsetzung erforderlich ist. | Optional Standard: NA Definieren Sie mindestens eine der Optionen AccessCIDR, PrefixList oder SecurityGroup, um eingehenden Datenverkehr zuzulassen, sofern Sie keine benutzerdefinierten Regeln für den eingehenden Datenverkehr für Sicherheitsgruppen erstellen. Achten Sie darauf, den Namen der PrefixList und nicht die ID einzugeben. |
SecurityGroup | Die virtuelle Firewall, die den ein- und ausgehenden Datenverkehr zur Instanz kontrolliert. | Optional Standard: NA Implementiert als Regelsatz, der angibt, welche Protokolle, Ports und IP-Adressen oder CIDR-Blöcke auf die Instanz zugreifen dürfen. Definieren Sie mindestens eines von AccessCIDR, PrefixList oder SecurityGroup, um eingehenden Datenverkehr zuzulassen, sofern Sie keine benutzerdefinierten Eingangsregeln für Sicherheitsgruppen erstellen. |
AIUnlimitedHttpPort | Der Port für den Zugriff auf die AI Unlimited-Benutzeroberfläche. | Erforderlich mit Standard Standard: 3000 |
AIUnlimitedGrpcPort | Der Port für den Zugriff auf die AI Unlimited API. | Erforderlich mit Standard Standard: 3282 |
AIUnlimitedVersion | Die Version von AI Unlimited, die Sie bereitstellen möchten. | Erforderlich mit Standard Standard: latest Der Wert ist ein Container-Versionstag. |
UsePersistentVolume | Gibt an, ob Sie zum Speichern von Daten ein neues oder vorhandenes persistentes Volume verwenden möchten. Weitere Informationen finden Sie unter Mehr erfahren: Persistentes Volume verwenden unter dem Parameterabschnitt. | Optional mit Standard Standard: New Unterstützte Optionen sind je nach Anwendungsfall ein neues oder ein vorhandenes dauerhaftes Volume. |
PersistentVolumeSize | Die Größe des persistenten Datenträgers, den Sie an die Instanz anhängen, in GB. | Erforderlich mit Standard Standard: 20 Unterstützt Werte zwischen 8 und 1000. |
ExistingPersistentVolumeId | Die ID des vorhandenen persistenten Datenträgers, den Sie an die Instanz anhängen. | Erforderlich, wenn UsePersistentVolume auf Vorhanden gesetzt ist. Standard: NA Das persistente Volume muss sich in derselben Verfügbarkeitszone wie die AI Unlimited-Instanz befinden. |
PersistentVolume DeletionPolicy | Das persistente Volume-Verhalten, wenn Sie die CloudFormation-Bereitstellung löschen. | Erforderlich mit Standard |
LatestAmiId | Die ID des Images, das auf die neueste AMI-Version verweist. Dieser Wert wird für die SSM-Suche verwendet. | Erforderlich mit Standard Standard: NA Diese Bereitstellung verwendet das neueste verfügbare Image ami-amazon-linux-latest/amzn2-ami-hvm-x86_64-gp2. WICHTIG: Das Ändern dieses Wertes kann den Stapel beschädigen. |
Mehr erfahren: Empfehlungen zum Manager-Instanztyp (Größe)
Für die kostenpflichtige öffentliche Vorschau von AI Unlimited empfehlen wir diese T3-Instanztypen, basierend auf der Anzahl gleichzeitiger Bereitstellungs- und Suspendierungsvorgänge der Engine. Die Leistung der anderen verfügbaren Instanztypen kann variieren.
Instanztyp | Gleichzeitige Vorgänge |
---|---|
t3.micro | 1 |
t3.small | bis zu 5 |
t3.medium | bis zu 10 |
t3.large | bis zu 20 |
t3.xlarge | mehr als 21 |
Die Parallelität wird zunehmen, wenn AI Unlimited zur allgemeinen Verfügbarkeit freigegeben wird.
Mehr erfahren: Persistentes Volume verwenden
Die Managerinstanz wird in einem Container ausgeführt und speichert ihre Konfigurationsdaten in einer Datenbank im Stammdatenträger der Instanz. Diese Daten bleiben erhalten, wenn Sie die Instanz herunterfahren, neu starten oder einen Snapshot erstellen und neu starten.
Ein persistentes Volume speichert Daten für eine containerisierte Anwendung über die Lebensdauer des Containers, Pods oder Knotens hinaus, in dem sie ausgeführt wird.
Ohne ein persistentes Volumen
Wenn der Container, Pod oder Knoten abstürzt oder beendet wird, gehen die Konfigurationsdaten des Managers verloren. Sie können eine neue Managerinstanz bereitstellen, jedoch nicht im selben Zustand wie die verlorene.
Mit einem persistenten Volumen
Wenn der Container, der Pod oder der Knoten abstürzt oder beendet wird und die Konfigurationsdaten des Managers in einem persistenten Volume gespeichert sind, können Sie eine neue Managerinstanz bereitstellen, die dieselbe Konfiguration wie die verlorene hat.
Beispiel
- Stellen Sie den Manager bereit und schließen Sie diese Parameter ein:
UsePersistentVolume
: NewPersistentVolumeDeletionPolicy
: Retain
- Nachdem Sie den Stapel erstellt haben, notieren Sie sich auf der Registerkarte Ausgaben die „volume-id“.
- Nutzen Sie AI Unlimited.
- Wenn die Managerinstanz verloren geht, stellen Sie den Manager erneut bereit und schließen Sie diese Parameter ein:
UsePersistentVolume
: NewPersistentVolumeDeletionPolicy
: RetainExistingPersistentVolumeId
: der Wert, den Sie in Schritt 2 notiert haben
Die neue Managerinstanz hat die gleiche Konfiguration wie die verlorene.
- Wählen Sie Weiter.
- Konfigurieren Sie die Stapeloptionen entsprechend Ihren Anforderungen und wählen Sie dann Weiteraus.
Überprüfen und Erstellen des Stapels
- Überprüfen Sie die Vorlageneinstellungen.
- Aktivieren Sie das Kontrollkästchen, um zu bestätigen, dass die Vorlage IAM-Ressourcen erstellen wird.
- Wählen Sie Übermitteln, um den Stapel bereitzustellen.
Auf der Registerkarte Ereignisse können Sie den Fortschritt überwachen. Wenn der Status aller RessourcenCREATE_COMPLETE
lautet, ist der Manager bereit.
Die Registerkarte Ausgaben zeigt die für die erstellten Ressourcen generierten Werte.
Sie benötigen die URL, um auf den Manager zuzugreifen und AI Unlimited einzurichten.
Wie geht es weiter?
Erstellen Sie eine OAuth-App, um die Authentifizierung zwischen AI Unlimited und Ihrem Git-Provider-Konto zu ermöglichen.