DevOps - SRE
Highspring
Job Description
About Highspring Highspring is a next-generation consulting and professional services firm. We deliver modern, agile, and forward-thinking solutions to our clients across North America. We work with innovative organizations in industries such as banking, insurance, and technology to help them build resilient and scalable digital platforms.
At Highspring, we foster technical excellence, collaboration, and meaningful business impact. The Opportunity We are looking for a Senior DevOps / Site Reliability Engineer (SRE) to join one of our large-scale digital delivery teams. In this role, you will play a key part in improving system reliability, scalability, and observability across complex environments combining modern and legacy technologies.
You will work closely with development and infrastructure teams to design resilient systems, optimize deployments, and ensure high availability of critical applications. What You'll Do Promote and implement best practices in resilience, stability, and observability across teams Collaborate with engineering teams to design scalable and reliable systems Automate repetitive tasks to reduce manual intervention and minimize errors Optimize infrastructure and applications to improve performance and reduce downtime (both non-prod and prod) Enhance deployment processes to enable fast, stable, and repeatable releases Analyze critical system flows and identify single points of failure Perform failure analysis and contribute to continuous improvement initiatives Support teams in improving documentation and architecture diagrams with resilience insights Participate in incident management, root cause analysis, and remediation Contribute to continuous system monitoring and performance anomaly detection Configure alerting mechanisms to ensure rapid response to critical issues What You Bring to the Table Bachelor's degree in Information Technology or related field 8+ years of experience in online service development within complex environments (modern + legacy systems) Strong analytical mindset with the ability to solve complex multi-system problems Excellent collaboration and communication skills across technical and non-technical stakeholders Core Skills Required Strong understanding of DevSecOps principles , monitoring, and observability Expertise designing systems supporting high concurrency and large-scale usage Proficiency in at least one programming/scripting language (Java, JavaScript, Python, Go, Bash) Experience with CI/CD tools and pipelines (GitHub, ArgoCD or similar) Strong experience with AWS cloud platform (development, deployment, operations) Infrastructure capacity analysis (CPU, memory, latency, IO, bandwidth, etc.) Solid networking knowledge (TCP/IP, DNS, load balancing, HTTP/HTTPS) Experience with monitoring/logging tools (Datadog, Splunk) Experience with load testing and performance analysis Experience working with relational and non-relational databases (MongoDB, Redis) Understanding of cybersecurity best practices Experience in incident management and post-mortem analysis Our Stack Cloud: AWS CI/CD: GitHub, ArgoCD Monitoring: Datadog, Splunk Databases: MongoDB, Redis Languages: Java, Python, Go, JavaScript, Bash Networking: TCP/IP, DNS, Load Balancers Why Join Highspring? Be part of a large, collaborative digital delivery organization Work on high-impact, large-scale transformation initiatives Contribute to building highly resilient and mission-critical systems Access continuous learning and cutting-edge technologies Thrive in a collaborative environment focused on innovation and excellence --- À propos de Highspring Highspring est une société de conseil et de services professionnels de nouvelle génération.
Nous livrons des solutions modernes, agiles et innovantes à nos clients à travers l'Amérique du Nord. Nous collaborons avec des organisations de premier plan dans des domaines tels que la banque, l'assurance et la technologie afin de bâtir des plateformes numériques performantes, résilientes et évolutives. Chez Highspring, nous valorisons l'excellence technique, la collaboration et l'impact concret.
L'opportunité Nous recherchons un(e) Ingénieur DevOps senior / SRE pour rejoindre une grande équipe de livraison numérique. Vous jouerez un rôle clé dans l'amélioration de la résilience, de la stabilité et de l'observabilité au sein d'environnements complexes combinant technologies modernes et systèmes legacy. Vous collaborerez étroitement avec les équipes de développement et d'infrastructure afin de concevoir des systèmes fiables, optimiser les déploiements et garantir la haute disponibilité des applications critiques.
Vos missions Promouvoir et mettre en œuvre les bonnes pratiques de résilience, stabilité et observabilité Collaborer avec les équipes pour concevoir des systèmes fiables et évolutifs Automatiser les tâches répétitives afin de limiter les interventions manuelles et les erreurs Optimiser les infrastructures et applications pour améliorer les performances et réduire les interruptions Améliorer les processus de déploiement pour garantir des mises en production rapides et stables Analyser les flux critiques et identifier les points de défaillance uniques Réaliser des analyses de défaillance et contribuer à l'amélioration continue Accompagner les équipes dans l'amélioration de la documentation et des architectures Participer à la gestion des incidents et à l'analyse des causes racines Contribuer à la surveillance continue et à la détection des anomalies Configurer les alertes pour permettre une réaction rapide aux incidents critiques Votre profil Diplôme Bac+5 en informatique ou domaine similaire Minimum 8 ans d'expérience en développement de services en ligne dans des environnements complexes Forte capacité d'analyse et de résolution de problèmes multi-systèmes Excellentes compétences en communication et collaboration Compétences clés Maîtrise des principes DevSecOps, monitoring et observabilité Expertise en conception de systèmes supportant un grand nombre d'utilisateurs Maîtrise d'au moins un langage (Java, JavaScript, Python, Go, Bash) Expérience avec les pipelines CI/CD (GitHub, ArgoCD) Expérience sur la plateforme AWS (développement, déploiement, opérations) Analyse de capacité d'infrastructure (CPU, mémoire, latence, IO, bande passante) Solides connaissances réseau (TCP/IP, DNS, load balancing, HTTP/HTTPS) Expérience avec les outils de monitoring (Datadog, Splunk) Expérience en tests de charge et analyse de performance Expérience avec bases de données relationnelles et non relationnelles (MongoDB, Redis) Connaissance des bonnes pratiques de sécurité informatique Expérience en gestion d'incident et post-mortem Notre stack Cloud : AWS CI/CD : GitHub, ArgoCD Observabilité : Datadog, Splunk Bases de données : MongoDB, Redis Langages : Java, Python, Go, JavaScript, Bash Réseaux : TCP/IP, DNS, load balancing Pourquoi rejoindre Highspring ? Rejoindre une équipe de delivery digitale d'envergure Travailler sur des projets stratégiques à fort impact Contribuer à des systèmes critiques et résilients Accéder à de la formation continue et aux technologies modernes Évoluer dans un environnement collaboratif et innovant