Coleta OpenTelemetry
Agentes que aceitam OTLP nativo, com normalização de atributos e enriquecimento por contexto de equipe. Compatível com instrumentação automática em Java, Go, Node e Python.
Agentes que aceitam OTLP nativo, com normalização de atributos e enriquecimento por contexto de equipe. Compatível com instrumentação automática em Java, Go, Node e Python.
Política de retenção por tipo de evento, por nível de severidade e por equipe. Eventos auditáveis sob LGPD ficam separados em armazenamento criptografado e replicado em duas regiões.
Um único identificador de trace acompanha o pedido do edge até o banco. Ao abrir um alerta, a leitura já contém o trace correspondente, os logs do período e as métricas dos serviços envolvidos.
Definição de objetivos de serviço com janela móvel e orçamento de erro auditável. Painel comparativo entre equipes que ajuda a priorizar trabalho de confiabilidade no trimestre seguinte.
Plantão recebe sugestão de hipóteses ordenadas por probabilidade durante incidentes. Reduz tempo médio até a primeira ação útil. Modelo treinado nos próprios incidentes do cliente, não compartilhado entre contas.
Painel de custo de telemetria por equipe, por aplicação e por mês. Alertas automáticos quando uma equipe passa do orçamento mensal acordado. Sem surpresa no fechamento do trimestre.
Cada serviço recebe uma identidade verificável renovada automaticamente. Substitui chaves estáticas e segredos compartilhados em arquivos de configuração. Auditoria por requisição em ambientes regulados.
Política de autorização em arquivos versionados, revisados em pull request. Quem pode chamar quem fica documentado, audível e diff-able. Bloqueios são propagados em segundos, não em ciclos de deploy.
Coexistência com Istio e Linkerd durante a transição. Serviços migrados convivem com os legados sem interromper o tráfego de produção. Reversão em qualquer ponto, sem perda de estado.
Cliente adota um núcleo. O ciclo de implantação termina em doze semanas e o time interno conduz a partir daí. Cabível em times pequenos com problema bem delimitado.
Combinação mais comum entre clientes em operação regulada. Observa instrumenta a Malha, ou Edge se apoia na Observa para roteamento por latência aferida em tempo real.
Adoção dos três núcleos em ciclo único. Indicado para operações nascendo do zero ou em reescrita após incidente regulatório, com foco em LGPD e em auditoria fim-a-fim.
Operamos onde o cliente decide. A plataforma roda em VPC do cliente em AWS, GCP, Azure ou em datacenter privado brasileiro. Não há ambiente compartilhado entre contas, e nenhum dado de telemetria sai da infraestrutura do cliente sem autorização explícita por contrato.
Os três núcleos têm núcleo aberto sob Apache 2.0, com módulos comerciais opcionais para conformidade, painel de custos e suporte com SLA contratual. O cliente pode operar a plataforma sem nós no terceiro ano se quiser. Não há cláusula de renovação automática.
Sim. A Observa separa dados pessoais em armazenamento criptografado com chaves geridas pelo cliente, e mantém trilha auditável de acesso por requisição. Já passamos por auditoria externa em três clientes regulados pelo BACEN. O relatório-tipo pode ser compartilhado sob NDA.
A migração costuma durar entre seis e dez semanas, dependendo do volume e da quantidade de painéis em uso. Mantemos o ambiente legado em paralelo durante o ciclo. A virada acontece quando o time interno confirma paridade de leitura, não antes.
Não comparamos. Nosso engajamento parte do princípio de que o time interno de SRE precisa existir e conduzir a operação depois. Trabalhamos para instalar a plataforma e a capacidade — não para substituir o time. Quando o cliente já tem SRE estruturado, o ciclo costuma terminar em menos tempo.
Hoje não. Toda a documentação, os ADRs e o canal de suporte são em português, e o estúdio mantém presença física apenas em São Paulo, Recife e Florianópolis. Pretendemos abrir uma unidade em Lisboa em 2027, mas ainda sem cronograma fechado.
Definido no primeiro dia, em uma página. Inclui o conjunto de capacidades que o time interno precisa demonstrar para conduzir sozinho — operação rotineira, resposta a incidente P0, decisão de capacidade para o próximo trimestre. Quando o critério é atingido, encerramos o ciclo e seguimos disponíveis em contrato trimestral, se o cliente quiser.
Mantemos três relatórios públicos, com nomes anonimizados, sobre engajamentos que terminaram em 2024 e 2025. Cobrem decisão técnica, custo final e o que o time interno conduz hoje. Compartilhamos sob NDA mínimo.