Azure Kuberbetes & Site Reliability Engineer (SRE)
Klanik
Date: 1 day ago
City: Montreal, QC
Contract type: Full time

KLANIK est une société de conseil en Ingénierie IT qui accompagne ses clients dans leurs projets digitaux et technologiques.
Le groupe KLANIK compte désormais plus de 750 talents, évoluant dans 16 agences en Europe, Amérique du Nord, Afrique et Moyen-Orient. Des experts engagés, atypiques et passionnés, impliqués dans des projets stratégiques grâce à leur haut niveau de compétences en Software, DevOps, Cloud, Agilité, Cybersécurité, Big Data & IA.
En Parallèle De Leurs Métiers, Les Collaborateurs Du Groupe KLANIK Sont Accompagnés Au Quotidien Dans Leur Développement Personnel Et Professionnel, Via Différentes Initiatives Engageantes Et Innovantes
KONSCIOUS : communauté interne engagée dans les enjeux écologiques, sociaux et environnementaux
KAMPUS : institut de formation technique certifié
KORNER : incubateur de start-ups technologiques
KLANIK ESPORT : club professionnel e-sport ouvert aux collaborateurs
Le Poste
Titre du poste : Ingénieur en Fiabilité de Site (SRE) - Kubernetes sur Azure
L'Ingénieur en Fiabilité de Site (SRE) spécialisé en Kubernetes sur Azure sera responsable de garantir la fiabilité, l'évolutivité et la disponibilité de la flotte Kubernetes de l'entreprise sur la plateforme Azure. Il travaillera en étroite collaboration avec les autres équipes SRE pour s'assurer que les services cloud de l'organisation respectent les objectifs de niveau de service (SLO) et les accords de niveau de service (SLA) requis.
Responsabilités Principales
Concevoir, mettre en œuvre et maintenir l'infrastructure Kubernetes et ses services transversaux pour assurer une haute disponibilité, évolutivité et performance.
Mettre en place et maintenir des procédures de surveillance, d'alerte et de réponse aux incidents pour garantir une réponse rapide aux problèmes système et de service.
Développer et maintenir des scripts et des outils d'automatisation pour rationaliser les processus de déploiement et de gestion des applications conteneurisées sur Kubernetes.
Collaborer avec les autres équipes SRE pour concevoir, mettre en œuvre et maintenir des plans de reprise après sinistre et de continuité des activités.
Développer et maintenir des politiques et procédures de sécurité pour garantir la sécurité des services Kubernetes sur Azure.
Se tenir à jour des nouvelles fonctionnalités et capacités de Kubernetes sur Azure et recommander des modifications ou des mises à niveau si nécessaire.
Fournir des conseils et des formations aux autres membres de l'équipe SRE sur les meilleures pratiques et procédures Azure.
Développer et maintenir la documentation relative à l'infrastructure et aux services Kubernetes sur Azure.
Profil
Diplôme en informatique, technologies de l'information ou domaine connexe.
Minimum de 5 ans d'expérience en ingénierie de fiabilité de site ou dans un rôle similaire, avec un accent sur l'infrastructure cloud sur la plateforme Azure.
Connaissance approfondie des services Kubernetes sur Azure, en particulier le calcul, le réseau et le stockage.
Expérience avec les outils d'automatisation Kubernetes tels que Terraform, Helm, FluxCD ou Kustomize.
Expérience en surveillance et création de tableaux de bord (Datadog, Grafana).
Excellentes compétences en résolution de problèmes et en dépannage.
Excellentes compétences en communication et en collaboration.
Les certifications Microsoft Azure sont préférées.
Le groupe KLANIK compte désormais plus de 750 talents, évoluant dans 16 agences en Europe, Amérique du Nord, Afrique et Moyen-Orient. Des experts engagés, atypiques et passionnés, impliqués dans des projets stratégiques grâce à leur haut niveau de compétences en Software, DevOps, Cloud, Agilité, Cybersécurité, Big Data & IA.
En Parallèle De Leurs Métiers, Les Collaborateurs Du Groupe KLANIK Sont Accompagnés Au Quotidien Dans Leur Développement Personnel Et Professionnel, Via Différentes Initiatives Engageantes Et Innovantes
KONSCIOUS : communauté interne engagée dans les enjeux écologiques, sociaux et environnementaux
KAMPUS : institut de formation technique certifié
KORNER : incubateur de start-ups technologiques
KLANIK ESPORT : club professionnel e-sport ouvert aux collaborateurs
Le Poste
Titre du poste : Ingénieur en Fiabilité de Site (SRE) - Kubernetes sur Azure
L'Ingénieur en Fiabilité de Site (SRE) spécialisé en Kubernetes sur Azure sera responsable de garantir la fiabilité, l'évolutivité et la disponibilité de la flotte Kubernetes de l'entreprise sur la plateforme Azure. Il travaillera en étroite collaboration avec les autres équipes SRE pour s'assurer que les services cloud de l'organisation respectent les objectifs de niveau de service (SLO) et les accords de niveau de service (SLA) requis.
Responsabilités Principales
Concevoir, mettre en œuvre et maintenir l'infrastructure Kubernetes et ses services transversaux pour assurer une haute disponibilité, évolutivité et performance.
Mettre en place et maintenir des procédures de surveillance, d'alerte et de réponse aux incidents pour garantir une réponse rapide aux problèmes système et de service.
Développer et maintenir des scripts et des outils d'automatisation pour rationaliser les processus de déploiement et de gestion des applications conteneurisées sur Kubernetes.
Collaborer avec les autres équipes SRE pour concevoir, mettre en œuvre et maintenir des plans de reprise après sinistre et de continuité des activités.
Développer et maintenir des politiques et procédures de sécurité pour garantir la sécurité des services Kubernetes sur Azure.
Se tenir à jour des nouvelles fonctionnalités et capacités de Kubernetes sur Azure et recommander des modifications ou des mises à niveau si nécessaire.
Fournir des conseils et des formations aux autres membres de l'équipe SRE sur les meilleures pratiques et procédures Azure.
Développer et maintenir la documentation relative à l'infrastructure et aux services Kubernetes sur Azure.
Profil
Diplôme en informatique, technologies de l'information ou domaine connexe.
Minimum de 5 ans d'expérience en ingénierie de fiabilité de site ou dans un rôle similaire, avec un accent sur l'infrastructure cloud sur la plateforme Azure.
Connaissance approfondie des services Kubernetes sur Azure, en particulier le calcul, le réseau et le stockage.
Expérience avec les outils d'automatisation Kubernetes tels que Terraform, Helm, FluxCD ou Kustomize.
Expérience en surveillance et création de tableaux de bord (Datadog, Grafana).
Excellentes compétences en résolution de problèmes et en dépannage.
Excellentes compétences en communication et en collaboration.
Les certifications Microsoft Azure sont préférées.
How to apply
To apply for this job you need to authorize on our website. If you don't have an account yet, please register.
Post a resumeSimilar jobs
Adjoint(e) principal(e), Ingénierie des systèmes - Soumissions
L3Harris Technologies,
Montreal, QC
1 day ago
L3Harris se fait un devoir de recruter et de former des talents performants qui sont passionnés par ce qu’ils font. Nos employés sont liés par un engagement commun envers leur croissance professionnelle et la mission de nos clients. L3Harris offre un environnement inclusif et engageant conçu pour responsabiliser les employés et encourager un équilibre entre le travail et la vie...

Wealth Management Operational Resilience Lead (Hybrid)
Morgan Stanley,
Montreal, QC
1 day ago
We’re seeking someone to join our team as a Wealth Management Operational Resilience Lead in Firm Resilience. As a member of our team, you will be in a unique position to interact with people and teams globally across different businesses and functions, working on topics that have a direct impact on the operational stability of the Firm.The Firm Resilience Function...

Transfer Pricing - Montreal - Senior Tax Staff
EY,
Montreal, QC
3 days ago
At EY, you’ll have the chance to build a career as unique as you are, with the global scale, support, inclusive culture and technology to become the best version of you. And we’re counting on your unique voice and perspective to help EY become even better, too. Join us and build an exceptional experience for yourself, and a better working...
