GPU Scanner

Oracle Cloud Infrastructure (OCI) GPU Scanner ist eine spezielle Lösung, die Beobachtbarkeit, Health Checks und Performance-Überwachung für GPU-Workloads bietet.

Warum OCI GPU Scanner?

  • Zentrale GPU-Überwachung

    OCI GPU Scanner ist eine zentralisierte, verwaltete Lösung für die Überwachung der GPU-Performance, die manuelle Recherchen und Skripterstellung überflüssig macht und den Benchmarking-Prozess vereinfacht.

  • Umsetzbare Erkenntnisse

    OCI GPU Scanner minimiert Ausfallzeiten und Fehlalarme durch umfassende Health Checks, Baseline-Vergleiche und automatisierte Diagnosen.

  • Cloud-native Flexibilität

    OCI GPU Scanner bietet anpassbare, mandantenweite Transparenz und teamspezifische Daten, mit denen die gemeinsame Verwendung von Ressourcenund das Kostenmanagement für GPU-Cluster der Unternehmensklasse optimiert werden können.

GPU Scanner-Funktionen

  • Zentrale GPU-Überwachung

    Eine verwaltete, zentralisierte Lösung, die die manuelle Ausführung von Skripten und Kompatibilitätsrecherchen in allen Regionen in einem Mandanten überflüssig macht. Ermöglicht Sharding-Transparenz für Teams, die große Cluster gemeinsam nutzen.

  • Umfassende Health Checks

    Detaillierte Health Checks für Tag Null (Ausgangswert), Tag eins (aktive Überwachung) und Tag zwei+ (fortlaufende Diagnose), einschließlich Knoten, mehrere Knoten und erweiterte Diagnosen mit historischen Vergleichen, um Probleme zu ermitteln.

  • Anbieterunabhängige Kompatibilität

    Unterstützt NVIDIA- und AMD-GPUs, wobei eine Ausweitung der Unterstützung auf zukünftige Chip-Hersteller und Architekturen der nächsten Generation geplant ist.

  • Überwachung auf Mandantenebene

    Überwacht GPU-Ressourcen in allen Regionen, ohne dass Installationen pro Region erforderlich sind. Unterstützt werden dabei Oracle Cloud Infrastructure Kubernetes Engine-Cluster, High Performance Computing-Cluster, Bare Metal und virtuelle Maschinen.

  • Cloud-native Integration

    Kompatibel mit gängigen Open Source-Tools, einschließlich Grafana und Prometheus, sodass anpassbare Dashboards und nahtlose Datenspeicherung/-export für Kundenanwendungsfälle möglich sind.

  • Umsetzbare Erkenntnisse und Automatisierung

    Bietet empfohlene Korrekturmaßnahmen (z. B. Neustart bei GPU-Off-Bus-Fehlern) und automatisiert Health Checks über API oder das Portal, wodurch Ausfallzeiten von Kunden und Fehlalarme reduziert werden.

Erste Schritte mit OCI GPU Scanner

Zugriff auf KI-Subject Matter Experts (SMEs)

Erhalten Sie Unterstützung beim Erstellen Ihrer nächsten KI-Lösung oder bei der Bereitstellung Ihrer Workloadd auf OCI GPU Scanner.

  • Sie können Fragen beantworten, z. B.

    • Wie sehen die ersten Schritte in Oracle Cloud Infrastructure WAF aus?
    • Welche Arten von KI-Workloads kann ich auf OCI ausführen?
    • Welche Arten von KI-Services bietet OCI an?

Erfahren Sie, wie Sie KI noch heute anwenden können

Erleben Sie eine neue Ära der Produktivität mit generativen KI-Lösungen für Ihr Unternehmen. Erfahren Sie, wie Oracle seinen Kunden hilft, KI über den gesamten Technologiebereich hinweg zu nutzen.

  • Was Sie mit Oracle Cloud erreichen können

    • Feinabstimmung von LLMs in OCI
    • Automatisierung der Rechnungsverarbeitung
    • Einen Chatbot mit RAG erstellen
    • Web-Inhalte mit generativer KI zusammenfassen
    • Und noch viel mehr!

Weitere Ressourcen

Erfahren Sie mehr über RDMA-Cluster-Networking, GPU-Instanzen, Bare Metal-Server und vieles mehr.

Erfahren Sie, welche Einsparungen mit OCI möglich sind.

Die Tarife für Oracle Cloud sind unkompliziert, mit weltweit konsequent niedrigen Tarifen und zahlreichen unterstützten Anwendungsfällen. Um den für Sie zutreffenden, niedrigen Tarif zu berechnen, gehen Sie zum Kostenrechner und konfigurieren Sie die Services entsprechend Ihrer Anforderungen.

Lernen Sie den Unterschied kennen:

  • 1/4 der Kosten für ausgehende Bandbreite
  • 3-mal besseres Preis-Leistungs-Verhältnis
  • Gleicher niedriger Preis in jeder Region
  • Niedrige Tarife ohne langfristige Verpflichtungen