Scanner de GPU

O Oracle Cloud Infrastructure (OCI) GPU Scanner é uma solução dedicada que fornece observabilidade, verificações de integridade e monitoramento de desempenho para cargas de trabalho de GPU.

Por que o OCI GPU Scanner?

  • Monitoramento centralizado de GPU

    O OCI GPU Scanner é uma solução centralizada e gerenciada para monitoramento de desempenho de GPU que ajuda a eliminar pesquisas e scripts manuais, simplificando o processo de benchmarking.

  • Insights úteis

    O OCI GPU Scanner minimiza o tempo de inatividade e os falsos positivos por meio de verificações abrangentes de integridade, comparações de linha de base e diagnósticos automatizados.

  • Flexibilidade nativa da nuvem

    O OCI GPU Scanner oferece visibilidade personalizável em todo o locatário e insights específicos da equipe que podem ajudar a otimizar o compartilhamento de recursos e o gerenciamento de custos para clusters de GPU em escala empresarial.

Recursos do scanner de GPU

  • Monitoramento centralizado de GPU

    Uma solução gerenciada e centralizada que elimina a execução manual de scripts e a pesquisa de compatibilidade em todas as regiões de uma tenancy. Permite a visibilidade de sharding para equipes que compartilham clusters grandes.

  • Verificações de integridade abrangentes

    Verificações detalhadas de integridade para o dia zero (linha de base), o dia um (monitoramento ativo) e o dia dois+ (diagnóstico em andamento), incluindo nó, multinó e diagnósticos avançados com comparações históricas para identificar problemas.

  • Compatibilidade independente de fornecedor

    Suporta GPUs NVIDIA e AMD, com planos de estender o suporte a futuras fabricantes de chips e arquiteturas de última geração.

  • Monitoramento no nível do locatário

    Monitora recursos de GPU em todas as regiões sem precisar de instalações por região, oferecendo suporte a clusters do Oracle Cloud Infrastructure Kubernetes Engine, clusters de computação de alto desempenho, bare metal e máquinas virtuais.

  • Integração nativa na nuvem

    Compatível com ferramentas populares de código aberto, incluindo Grafana e Prometheus, permitindo painéis personalizáveis e armazenamento/exportação de dados contínuos para casos de uso do cliente.

  • Insights acionáveis e automação

    Fornece ações de correção recomendadas (por exemplo, reinicialização para erros off-bus de GPU) e automatiza verificações de integridade por meio de API ou portal, reduzindo o tempo de inatividade do cliente e falsos positivos.

Conheça o OCI GPU Scanner

Acesse especialistas em assuntos de IA

Receba ajuda para criar sua próxima solução de IA ou implementar sua carga de trabalho com o OCI GPU Scanner.

  • Eles podem responder a perguntas como:

    • Como começar a usar a Oracle Cloud?
    • Que tipos de cargas de trabalho de IA posso executar na OCI?
    • Quais tipos de serviços de IA a OCI oferece?

Veja como aplicar IA hoje mesmo

Entre em uma nova era de produtividade com soluções de IA generativas para sua empresa. Saiba como a Oracle ajuda os clientes a aproveitar a IA incorporada em toda a pilha de tecnologia.

  • O que você pode alcançar com o Oracle AI?

    • Ajuste LLMs na OCI
    • Automatize o processamento de faturas
    • Crie um chatbot com RAG
    • Resuma conteúdo da web com IA generativa
    • E muito mais!

Recursos adicionais

Saiba mais sobre rede de cluster RDMA, instâncias de GPU, servidores bare metal e muito mais.

Veja o quanto pode você pode economizar com a OCI

Os preços da Oracle Cloud são simples, com preço baixo consistente em todo o mundo, oferecendo suporte a uma ampla gama de casos de uso. Para estimar a sua taxa, consulte a estimativa de custos e configure os serviços para atender às suas necessidades.

Experimente a diferença

  • 1/4 dos custos de largura de banda de saída
  • 3X o custo-benefício de computação
  • Mesmo preço em todas as regiões
  • Preços baixos sem compromissos de longo prazo