Site Reliability Engineer
A Randstad Digital está a recrutar um Site Reliability Engineer para integração direta num cliente em Lisboa.
Regime de trabalho Híbrido.
responsabilidades chave
- Conceber, implementar e monitorizar Indicadores de Nível de Serviço (Service Level Indicators - SLIs) e Objetivos de Nível de Serviço (Service Level Objectives - SLOs) para os nossos serviços de produção.
- Escrever código e scripts (por exemplo, Python, Go, Bash) para automatizar tarefas operacionais, o provisionamento do sistema e a remediação de incidentes.
- Atuar como um interveniente chave na resposta a incidentes de produção.
- Participar num regime de prevenção (on-call rotation) 24/7, liderar os esforços de diagnóstico (troubleshooting) e conduzir os incidentes até à resolução.
- Liderar e participar em análises pós-incidente "sem culpas" para identificar as causas raiz e implementar ações corretivas duradouras.
- Colaborar com as equipas de desenvolvimento para conceber, construir e implementar sistemas escaláveis, altamente disponíveis e tolerantes a falhas.
- Construir e manter soluções abrangentes de monitorização e registo (logging) (por exemplo, Prometheus, Grafana, ELK Stack, Datadog) para detetar e diagnosticar problemas de forma proativa.
- Monitorizar o desempenho e a utilização do sistema, prever a procura e planear as necessidades futuras de capacidade.
- Identificar e eliminar o trabalho operacional manual e repetitivo através da criação de soluções automatizadas e duradoura.
competências
- Licenciatura em engenharia informática, ciências da computação ou área similar.
- + 5 anos de experiência em Engenharia de Fiabilidade de Sistemas (Site Reliability Engineering), engenharia de software ou administração de sistemas em grande escala.
- Forte experiência com plataformas cloud (AWS, Azure).
- Proficiência com ferramentas de Infraestrutura como Código (Ia
C) (por exemplo, Terraform, Ansible, Cloud
Formation). - Experiência prática com ferramentas CI/CD (por exemplo, Jenkins, Git
Lab CI, Git
Hub Actions). - Sólido entendimento de tecnologias de contentorização (Docker) e sistemas de orquestração (Kubernetes).
- Experiência com sistemas de controlo de versões, particularmente Git.
- Familiaridade com ferramentas de monitorização e logging (registo) (por exemplo, Prometheus, Grafana, ELK Stack).
- Uma abordagem sistemática e baseada em dados para a resolução de problemas e diagnóstico (troubleshooting).
- Experiência com regimes de prevenção (on-call rotations) e gestão de incidentes.
principais benefícios
- Remuneração base competitiva;
- Subsídio de alimentação;
- Seguro de Saúde;
- Prémio Anual;
- Regime de trabalho flexível.
- Informações detalhadas sobre a oferta de emprego
Empresa: Randstad II - Prestação de Serviços, Limitada Localização: Lisboa
Lisboa, Lisboa, PortugalPublicado: 29. 11. 2025
Vaga de emprego atual
Seja o primeiro a candidar-se à vaga de emprego oferecida!