CGI Technologies et Solutions Maroc
OffresCasablanca ou RabatSite Reliability Engineer (SRE) – AI-Driven & AIOps Oriented (H/F)

Site Reliability Engineer (SRE) – AI-Driven & AIOps Oriented (H/F)

CGI Technologies et Solutions Maroc- Informatique / Electronique - Internet / Multimédia- Informatique - Internet / Multimédia
Casablanca ou RabatCDIConfirmé (5 à 10 ans) d'experienceBac +5 et plus Minimum

Creez un compte NewJob.ma avant de continuer sur le site web de l'entreprise.

Description du poste

Nous recherchons un(e) Site Reliability Engineer (SRE) passionné(e) par l’automatisation, la fiabilité des systèmes et les technologies d’intelligence artificielle appliquées aux opérations IT (AIOps).

Dans ce rôle, vous serez responsable de la disponibilité, de la performance, de la scalabilité et de la résilience des plateformes de production. Vous contribuerez à la transformation des opérations vers un modèle proactif et prédictif grâce à l’utilisation de solutions AIOps, de l’automatisation avancée et de l’observabilité moderne.

Vous travaillerez en étroite collaboration avec les équipes de développement, d’exploitation, de support et de gestion des incidents afin d’améliorer continuellement la qualité de service et l’expérience utilisateur.

Fonctions et responsabilités :


Fiabilité et performance des systèmes

  • Concevoir, déployer et maintenir des infrastructures et applications fiables, évolutives et sécurisées.
  • Définir et piloter les indicateurs de fiabilité (SLI), les objectifs de niveau de service (SLO) et les budgets d’erreur.
  • Assurer la surveillance proactive des plateformes et garantir leur disponibilité.
  • Analyser les performances des systèmes et mettre en œuvre les améliorations nécessaires.


Observabilité et supervision

  • Développer et améliorer les solutions d’observabilité basées sur les métriques, les logs et les traces.
  • Mettre en place des tableaux de bord et indicateurs permettant un suivi en temps réel de l’état des services.
  • Identifier les tendances et les signaux faibles afin d’anticiper les incidents.


AIOps et automatisation

  • Mettre en œuvre des solutions AIOps pour la détection d’anomalies, l’analyse prédictive et l’automatisation des opérations.
  • Développer des mécanismes d’auto-remédiation pour les incidents récurrents.
  • Automatiser les processus opérationnels à travers l’Infrastructure as Code (IaC), les pipelines CI/CD et les workflows de remédiation.
  • Exploiter les modèles d’intelligence artificielle et de machine learning afin d’améliorer la qualité des alertes et réduire le bruit opérationnel.
  • Intégrer les plateformes AIOps avec les outils ITSM pour automatiser la création et le routage des tickets.


Gestion des incidents et amélioration continue

  • Participer à la gestion des incidents majeurs et coordonner les actions de résolution.
  • Conduire les analyses post-incidents et les démarches d’amélioration continue.
  • Collaborer avec les équipes Support (L1, L2, L3) et les Problem Managers pour réduire les incidents récurrents.
  • Promouvoir les bonnes pratiques SRE, DevOps et AIOps au sein de l’organisation.


Accompagnement et expertise

  • Contribuer à la montée en compétences des équipes techniques.
  • Évaluer et intégrer de nouveaux outils d’automatisation, d’observabilité et d’intelligence artificielle.
  • Participer aux initiatives d’innovation visant à renforcer l’efficacité opérationnelle.

Profil recherche

Compétences techniques

  • Minimum 5 ans d’expérience en Site Reliability Engineering, DevOps ou exploitation de systèmes critiques.
  • Solide expérience des environnements Cloud, idéalement Microsoft Azure.
  • Maîtrise des technologies de conteneurisation et d’orchestration (Docker, Kubernetes).
  • Expérience des outils CI/CD tels que Git, GitLab et Jenkins.
  • Bonne connaissance des solutions Infrastructure as Code (Terraform, Ansible ou équivalent).
  • Expérience pratique des outils d’observabilité et de monitoring (Grafana, Prometheus, Splunk).
  • Connaissance des plateformes AIOps et de supervision intelligente (ServiceNow AI, Dynatrace, Datadog ou équivalent).
  • Excellentes compétences en scripting ou développement (Python, Java ou langage similaire).
  • Bonne compréhension des architectures distribuées, du réseau et de la performance des systèmes.

Compétences comportementales

  • Forte capacité d’analyse et de résolution de problèmes complexes.
  • Approche proactive et orientée amélioration continue.
  • Esprit d’innovation et intérêt pour les technologies d’intelligence artificielle appliquées aux opérations.
  • Excellentes capacités de communication et de collaboration.
  • Aptitude à travailler dans des environnements transverses et multiculturels.
  • Sens du service et orientation client.
  • Capacité à accompagner et à mentoriser des équipes techniques.

Traits de personnalite souhaites

Recherche de nouveautéRespect des règlesExtraversionIntuition / SpontanéitéTravail en équipeEquilibre personnelAmbition
Site Reliability Engineer (SRE) – AI-Driven & AIOps Oriented (H/F) - CGI Technologies et Solutions Maroc - Casablanca ou Rabat | NewJob.ma