Sobre a função
Procuramos um(a)
Site Reliability Engineer
com experiência comprovada em ambientes
Kubernetes
ou
OpenShift
, para integrar a nossa equipa técnica. O(a) profissional será responsável por garantir a fiabilidade, escalabilidade e segurança dos nossos sistemas, colaborando com equipas de desenvolvimento e operações para melhorar continuamente os nossos serviços.
Responsabilidades
* Assegurar a disponibilidade e desempenho dos sistemas em produção.
* Automatizar processos de deployment, monitorização e resposta a incidentes.
* Desenvolver e manter pipelines CI/CD robustos e seguros.
* Gerir e optimizar clusters Kubernetes/OpenShift.
* Implementar soluções de observabilidade (logs, métricas, tracing).
* Participar na gestão de incidentes e na elaboração de análises pós-incidente.
* Trabalhar com SLOs, SLIs e SLAs para medir e melhorar a fiabilidade dos serviços.
* Colaborar com equipas de desenvolvimento na melhoria da arquitetura e práticas de engenharia.
Requisitos
* Experiência prática com
Kubernetes
ou
OpenShift
em ambientes de produção.
* Conhecimentos em ferramentas de monitorização como Prometheus, Grafana, ELK, Datadog ou equivalentes.
* Experiência com infraestrutura como código (Terraform, Ansible, Helm).
* Domínio de linguagens de scripting (Python, Bash, Go).
* Experiência com ferramentas de CI/CD (Jenkins, GitLab CI, ArgoCD, etc.).
* Familiaridade com práticas DevOps e cultura de fiabilidade.
* Inglês técnico (leitura e escrita).
Valorizamos
* Certificações como CKA, CKAD ou Red Hat OpenShift.
* Experiência com ambientes multi-cloud (AWS, Azure, GCP).
* Conhecimentos em segurança em ambientes cloud-native.
* Participação em comunidades técnicas ou projetos open-source.