
Mission :
Alton recherche en urgence pour le compte de son client bancaire, les profils suivants :
IA Engineers Senior
Profil :
4–7 ans d'expérience en développement logiciel Dont au moins 18 mois sur des projets GenAI / LLM en production Capacité à travailler en squad agile Esprit produit et industrialisation
Techniques :
• Language et framework :
- Python avancé
- Maitrise de LangGraph ou LangChain avec une forte composante état/state managment
- Expérience avec le protocole MCP pour l’intégration des outils
• Architecture et APIs
- Connaissance des architecture Micro-services et des protocoles d’authentification
- Expérience avec les bases de données Vectorielles ( Ex : Milvus ; Qdrant, Weaviate, etc.)
• Outils de Déploiement :
Docker / Kubernetes/ CI/CD Bonus
• Fine-tuning LLM
LLMOps Engineer :
Mission :
- Industrialisation & CI/CD : Mise en place Model Registry et automatisation des pipelines CI/CD pour les modèles et les agents IA.
- Observabilité Conversationnelle : Mise en place du tracing de sessions et scoring qualité par tour pour auditer les échecs
- Sécurité et PII : Implémentation de pipeline de scrubbing PII et masqage de données sensibles
- Gouvernance de couts : monitoring de la consommation de tokens par cas d’usage et mise en place des rates-limiting stratégies
- Gouvernance des agents : gestion du cycle de vie des agents et politique de promotion
- Réponses au incidents : création de runbooks spécifiques et d’un kill switch en cas de dérive
- Déploiement : gestion des ressources compute et isolation des accès aux modèles on prem
- Orchestration : Maitrise avancée de Kubernetes (Déploiement, scaling, operator patterns …)
- Test A/B : Framework d’expérimentation contrôlés sur des variantes de prompts ou des flux agents en production
- Gestion des secrets : Sécurisation des pipelines IA : secrets management, network policies, contrôle d'accès aux APIs LLM
Profil :
5+ ans d'expérience DevOps / MLOps ou SRE avec une expérience concrète en production ML/LLM — au moins un pipeline LLM ou système IA industrialisé et opéré en production Forte culture d'industrialisation, de fiabilité et de sécurité opérationnelle
Techniques :
• Infrastructure : Kubrenetes avancée, gestion des GPUs
• Monitoring & tracing : Pormetheus, Grafana, Dynatrace ainsi que des outils spéifiques LLM ( LangSmith, Arize, Helicone)
• CI/CD : GitLab, Jenkins, ArgoCD
• MLflow ou équivalent (Model Registry),
• Compréhension des plateformes d’orchestration type LangGraph, LangChain et des protocoles d’intégration type MCP
• Sécurité cloud / on-prem
Bonus :
• Dynamic routing basé sur le coût : routage intelligent vers modèles moins coûteux selon complexité de la requête
• Gestion infrastructure GPU
Détails:
Contrat : Freelance
Localisation : Casablanca
Durée : Longue durée
Démarrage : ASAP
Expérience : +5/+10 ans
Formation : BAC+5