Observability Architect (ou arquiteto de observabilidade) é o profissional responsável por definir, projetar e implementar a estratégia de observabilidade de sistemas em uma organização. O foco é garantir que aplicações, infraestruturas e serviços sejam monitoráveis de forma eficiente, possibilitando deteção proativa de problemas, troubleshooting rápido e melhoria contínua da performance.
Principais responsabilidades:
1. Desenhar a arquitetura de observabilidade: Definir como logs, métricas e traces serão coletados, armazenados e visualizados. Escolher ferramentas adequadas (como Prometheus, Grafana, OpenTelemetry, Elastic Stack, Datadog, New Relic, etc.). Integrar soluções com pipelines CI/CD e infraestruturas em nuvem (AWS, Azure, GCP).
2. Implementar padrões de instrumentação: Garantir que aplicações estejam corretamente instrumentadas para gerar métricas, logs e traces relevantes. Trabalhar com engenheiros de software e SREs para definir boas práticas de observabilidade no código.
3. Definir KPIs e SLIs/SLOs: Trabalhar com times de produto, DevOps e negócios para mapear indicadores que reflitam a saúde do sistema (ex: latência, disponibilidade, erros, throughput).
4. Automatizar e escalar a observabilidade: Criar automações para onboarding de novos serviços na stack de observabilidade. Desenvolver dashboards e alertas eficientes que evitem ruído (alert fatigue).
5. Fomentar cultura de observabilidade: Educar os times sobre a importância da observabilidade para confiabilidade e performance. Liderar iniciativas de melhoria contínua da visibilidade dos sistemas.
Skills e conhecimentos comuns:
1. Conceitos: Telemetria, tracing distribuído, métricas, logs estruturados, SRE, DevOps, SLIs/SLOs/SLAs.
2. Linguagens e Infra: Experiência com containers (Docker, Kubernetes), pipelines CI/CD, APIs, eventualmente programação (Go, Python, Java).
3. Cloud e automação: AWS CloudWatch, Azure Monitor, Terraform, Ansible, etc.
#J-18808-Ljbffr