Oracle Cloud Infrastructure (OCI) GPU Scanner ist eine spezielle Lösung, die Beobachtbarkeit, Health Checks und Performance-Überwachung für GPU-Workloads bietet.
Verpassen Sie nicht unsere exklusive Live-Demo am 30. Oktober, in der wir die Bereitstellung von Llama auf OCI zeigen. Erleben Sie neueste Generative-AI-Technologien in Aktion, entdecken Sie praxisnahe Anwendungsfälle und lernen Sie Schritt für Schritt, wie Sie intelligentere, stärker automatisierte Workflows aufbauen.
Die führenden Architekten von OCI zeigen, wie Clusternetzwerke skalierbare GenAI ermöglichen – von wenigen GPUs bis hin zu einem Zettascale-OCI-Supercluster mit 131.072 NVIDIA-Blackwell-GPUs.
Die KI-Infrastruktur von Oracle ist skalierbar, leistungsstark und überall einsetzbar. Erfahren Sie, warum wir uns durch branchenführende Skalierbarkeit, Bare-Metal-GPU-Instanzen und vieles mehr auszeichnen.
Entdecken Sie die Einschätzung von Analysten zur OCI KI-Infrastruktur mit AMD-GPUs – und wie diese Kombination die Produktivität steigern, die Time-to-Value verkürzen und Energiekosten senken kann.
OCI GPU Scanner ist eine zentralisierte, verwaltete Lösung für die Überwachung der GPU-Performance, die manuelle Recherchen und Skripterstellung überflüssig macht und den Benchmarking-Prozess vereinfacht.
OCI GPU Scanner minimiert Ausfallzeiten und Fehlalarme durch umfassende Health Checks, Baseline-Vergleiche und automatisierte Diagnosen.
OCI GPU Scanner bietet anpassbare, mandantenweite Transparenz und teamspezifische Daten, mit denen die gemeinsame Verwendung von Ressourcenund das Kostenmanagement für GPU-Cluster der Unternehmensklasse optimiert werden können.
Eine verwaltete, zentralisierte Lösung, die die manuelle Ausführung von Skripten und Kompatibilitätsrecherchen in allen Regionen in einem Mandanten überflüssig macht. Ermöglicht Sharding-Transparenz für Teams, die große Cluster gemeinsam nutzen.
Detaillierte Health Checks für Tag Null (Ausgangswert), Tag eins (aktive Überwachung) und Tag zwei+ (fortlaufende Diagnose), einschließlich Knoten, mehrere Knoten und erweiterte Diagnosen mit historischen Vergleichen, um Probleme zu ermitteln.
Unterstützt NVIDIA- und AMD-GPUs, wobei eine Ausweitung der Unterstützung auf zukünftige Chip-Hersteller und Architekturen der nächsten Generation geplant ist.
Überwacht GPU-Ressourcen in allen Regionen, ohne dass Installationen pro Region erforderlich sind. Unterstützt werden dabei Oracle Cloud Infrastructure Kubernetes Engine-Cluster, High Performance Computing-Cluster, Bare Metal und virtuelle Maschinen.
Kompatibel mit gängigen Open Source-Tools, einschließlich Grafana und Prometheus, sodass anpassbare Dashboards und nahtlose Datenspeicherung/-export für Kundenanwendungsfälle möglich sind.
Bietet empfohlene Korrekturmaßnahmen (z. B. Neustart bei GPU-Off-Bus-Fehlern) und automatisiert Health Checks über API oder das Portal, wodurch Ausfallzeiten von Kunden und Fehlalarme reduziert werden.
Erhalten Sie Unterstützung beim Erstellen Ihrer nächsten KI-Lösung oder bei der Bereitstellung Ihrer Workloadd auf OCI GPU Scanner.
Erleben Sie eine neue Ära der Produktivität mit generativen KI-Lösungen für Ihr Unternehmen. Erfahren Sie, wie Oracle seinen Kunden hilft, KI über den gesamten Technologiebereich hinweg zu nutzen.
Erfahren Sie mehr über RDMA-Cluster-Networking, GPU-Instanzen, Bare Metal-Server und vieles mehr.
Die Tarife für Oracle Cloud sind unkompliziert, mit weltweit konsequent niedrigen Tarifen und zahlreichen unterstützten Anwendungsfällen. Um den für Sie zutreffenden, niedrigen Tarif zu berechnen, gehen Sie zum Kostenrechner und konfigurieren Sie die Services entsprechend Ihrer Anforderungen.
Live Demo Day: Experten von Oracle, Meta und NVIDIA stellen Llama auf OCI bereit
First Principles: Zettascale OCI Superclusters
Beschleunigung von KI-Workloads mit OCI (PDF)
Enterprise Strategy Group auf AMD Instinct MI300X