Observability Architect (ou arquiteto de observabilidade) é o profissional responsável por definir, projetar e implementar a estratégia de observabilidade de sistemas em uma organização. O foco é garantir que aplicações, infraestruturas e serviços sejam monitoráveis de forma eficiente, possibilitando deteção proativa de problemas, troubleshooting rápido e melhoria contínua da performance.
Principais responsabilidades:
* Desenhar a arquitetura de observabilidade:
o Definir como logs, métricas e traces serão coletados, armazenados e visualizados.
o Escolher ferramentas adequadas (como Prometheus, Grafana, OpenTelemetry, Elastic Stack, Datadog, New Relic, etc.).
o Integrar soluções com pipelines CI/CD e infraestruturas em nuvem (AWS, Azure, GCP).
* Implementar padrões de instrumentação:
o Garantir que aplicações estejam corretamente instrumentadas para gerar métricas, logs e traces relevantes.
o Trabalhar com engenheiros de software e SREs para definir boas práticas de observabilidade no código.
* Definir KPIs e SLIs/SLOs:
o Trabalhar com times de produto, DevOps e negócios para mapear indicadores que reflitam a saúde do sistema (ex: latência, disponibilidade, erros, throughput).
* Criar automações para onboarding de novos serviços na stack de observabilidade.
* Desenvolver dashboards e alertas eficientes que evitem ruído (alert fatigue).
* Fomentar cultura de observabilidade:
o Educar os times sobre a importância da observabilidade para confiabilidade e performance.
o Liderar iniciativas de melhoria contínua da visibilidade dos sistemas.
Skills e conhecimentos comuns:
* Conceitos: Telemetria, tracing distribuído, métricas, logs estruturados, SRE, DevOps, SLIs/SLOs/SLAs.
* Linguagens e Infra: Experiência com containers (Docker, Kubernetes), pipelines CI/CD, APIs, eventualmente programação (Go, Python, Java).
* Cloud e automação: AWS CloudWatch, Azure Monitor, Terraform, Ansible, etc.
#J-18808-Ljbffr