L’édition 2026 des Cloud Native Days a confirmé la maturité de l’écosystème devops et cloud native en France avec des sujets qui dépassent largement les seuls outils et bonnes pratiques.
Les conférences touchent désormais à des problématiques complexes liées à l’exploitation à grande échelle, au besoin de plateformes “as a service” au sein des grandes organisations ou encore à des aspects de haute technicité dans tous les domaines de l’infrastructure (réseau, sécurité, bases de données, etc).
Dans notre premier article, nous vous proposions la rétro de notre participation pour faire de cet évènement un joli succès communautaire ! Aujourd’hui, pour vous aider face à la richesse des contenus proposés, nous avons sélectionné (de façon forcément un peu subjective :-P) les dix conférences qui nous ont particulièrement marqué(e)s : pour leur profondeur technique, la qualité et l’intérêt du retour d’expérience, ou bien les réflexions et les perspectives qu’elles soulèvent…
Notre top 10 des conférences
☁️ Cloud On-Premise : REX Mistral AI - Construire un fournisseur cloud de zéro : ClusterAPI dans le datacenter
Nous connaissons bien Mistral AI car nous avons construit et opéré en 24/7 leur plateforme d’inférence multi-cloud lors du lancement de leurs services en 2023. Ce talk retour d’expérience propose une plongée dans d’autres coulisses de Mistral, avec le choix de bâtir son propre cloud on-premise pour répondre à ses besoins extrêmes en calcul pour l’IA.
L’approche repose sur une forte industrialisation : Cluster API pour la gestion des clusters K8s, Metal³ pour orchestrer les serveurs bare metal avec une logique déclarative, et Kamaji pour mutualiser les control planes, une optimisation quasi indispensable lorsqu’on opère à très grande échelle.
Au-delà des briques techniques, ce qui rend selon nous cette conférence intéressante, c’est la problématique globale et les détails techniques abordés : comment recréer dans un environnement on-premise une expérience proche de celle sur un cloud provider avec toutes les contraintes hardware. On aime ce talk car on nous dévoile les couches basses infra sur lesquelles nous aimons travailler : le provisioning, la compatibilité matérielle, les limites physiques des serveurs, les questions réseau complexes, etc.
On apprécie aussi la transparence des équipes Mistral AI et le fort aspect RETEX. Ils ne se contentent pas de présenter une architecture idéale, ils partagent aussi les limites rencontrées (ARM, etcd, gestion des événements…) et les arbitrages techniques réalisés pour tenir la charge.
Lien vers le replay.
Intervenants : Léonard Suslian et Antoine Roy (Mistral AI).
🗄️ Data / Infra : REX Sellsy - Migrer 50 000 BDDs sans coupure vers PostgreSQL et K8s : mission impossible ?
Forcément, nous ne sommes pas neutres pour faire figurer cette conférence dans le top 10, mais nous n’avons eu que des retours élogieux ! Avec notre client Sellsy (merci Quentin Loupot !), nous nous sommes déguisés en pirates pour partager un retour d’expérience particulièrement riche autour de la modernisation et de la migration de leur architecture de bases de données au sein de clusters K8s. Les grandes lignes structurantes :
- Passage d’une base de données unique multi-tenant centralisée à 50 000 bases de données distribuées et dédiées par tenant
- Migration de MariaDB vers PostgreSQL en utilisant l’excellent opérateur “CloudNativePG” pour Kubernetes
Cette approche s’appuie sur une infrastructure bare metal optimisée (NVMe, ZFS) déployée chez Scaleway, permettant de concilier performance et maîtrise des coûts.
La complexité du projet réside toutefois ailleurs, avec une refonte applicative pour supporter le multi-Database, un double Run entre les deux environnements avec mécanismes de rollback éventuels pour préserver la disponibilité du service, une gestion d’incidents inattendus, et une charge importante sur les équipes pendant toute la durée de la migration des applications de leurs milliers de clients.
Un grand moment sur la grande scène, avec un état d’esprit décontracté, nous sommes sûrs que ce talk vous plaira !
Lien vers le replay.
Intervenants : Quentin Loupot (Sellsy) et Alexandre Buisine (Enix).
💾 Stockage / Backup : La résilience Cloud Native avec la solution open source Plakar
Nous croyons fortement en la solution de back-up open source récente (2025) proposée par Plakar. Créée par Julien Mangeard et Gilles Chehade, Plakar apporte une approche moderne (révolutionnaire ?) de la sauvegarde de données avec un format ouvert, portable et adapté aux environnements cloud et DevOps. Il nous paraissait donc indispensable de mettre en avant cette conférence.
Celle-ci décrit les limites des approches de sauvegarde traditionnelles : pas/peu de prise en compte du contexte applicatif, dépendance à des solutions propriétaires, absence de validation régulière des backups, etc. Elle met également en lumière un angle souvent négligé, celui de la capacité réelle à restaurer efficacement, au-delà du simple stockage des sauvegardes.
Plakar permet de sauvegarder des données (fichiers, bases, serveurs, cloud, etc.) sous forme de snapshots versionnés, stockés dans un moteur appelé Kloset.
La solution intègre nativement déduplication, compression et chiffrement de bout en bout, ce qui réduit le stockage nécessaire et sécurise les sauvegardes.
Plakar a annoncé lors de cette édition 2026 de Cloud Native Days France le support de Kubernetes, mais cette solution est compatible avec de nombreux autres environnements et applications (e.g. de l’infrastructure comme Proxmox VE, ou des solutions de Drive, etc.).
Lien vers le replay.
Intervenants : Gilles Chehade (Plakar).
🔐 Sécurité : REX Numberly - Automatiser la gestion des identifiants DB dans k8s avec Vault et vault-db-injector
Ce retour d’expérience particulièrement pointu techniquement s’attaque au problème bien connu de la gestion des credentials dans des environnements distribués et dynamiques. Malgré des outils éprouvés, la rotation et la sécurisation des identifiants restent complexes à grande échelle.
La solution proposée repose sur un changement de paradigme, abandonner les credentials statiques au profit d’identifiants dynamiques, générés et directement liés au cycle de vie des pods.
Grâce à l’utilisation de Vault et d’un mécanisme d’injection automatique via mutating webhook, les accès sont créés, renouvelés et révoqués de manière transparente et sans impact côté applicatif.
Avec des dizaines de milliers de credentials générés chaque jour et une durée de vie très courte, cette approche permet de réduire drastiquement la surface de risque tout en simplifiant l’exploitation.
Lien vers le replay.
Intervenants : Solvik Blum et Guillaume Legrain (Numberly).
🤖 IA / LLM sur K8s : REX Mirakl - Déployer nos modèles : C’est simple avec KServe
Ce retour d’expérience illustre parfaitement les défis liés au passage en production des modèles de machine learning, en particulier dans des contextes à forte contrainte de latence et de scalabilité.
Mirakl nous montre que le choix de KServe avec Kubernetes permet de standardiser le déploiement des modèles, d’automatiser leur mise à l’échelle et de simplifier leur gestion au quotidien. En pratique, un simple manifeste permet de déployer un modèle complet, avec exposition réseau, le bon autoscaling et la bonne observabilité.
Un point particulièrement intéressant concerne l’adoption par les équipes data. Tout est fait pour réduire la friction : abstraction des concepts Kubernetes, outils dédiés, templates et dashboards accessibles.
Lien vers le replay.
Intervenants : Alexandre Nguyen et Yannick Lambruschi (Mirakl).
🩺 Opérations : REX Decathlon - Ne plus avoir peur du vendredi aprem’ et déployer sereinement avec Flagger
Derrière ce titre clin d’œil à la fameuse règle des développeurs et ingénieurs systèmes, ce talk coche beaucoup de cases sur un sujet que rencontrent tous ceux qui travaillent sur des plateformes critiques : comment s’assurer de déployer en production sans stress… et sans tout casser.
Le retour d’expérience de Decathlon évoque leur contexte hyper exigeant (e-commerce et multi-tenant), où chaque déploiement peut avoir un impact business (ou sur les process internes critiques) immédiat à grande échelle.
Pour tester en production de manière progressive et pilotée, Flagger est utilisé pour orchestrer des déploiements canary automatisés, avec exposition progressive du trafic et rollback en cas de problème. Mais ce que nous retenons particulièrement, c’est l’importance de la qualité des métriques : sans signaux fiables, l’automatisation perd vite de sa valeur.
Ce talk met aussi en lumière des aspects très concrets : latence des outils d’observabilité, limites d’intégration, nécessité de fallback manuels…
Un retour d’expérience concret qui parle autant d’outillage que de bonnes pratiques, tout ce qu’on aime quand on fait de l’Ops !
Lien vers le replay.
Intervenants : Maxime Véroone et Johan Lore (Decathlon).
☸️ Multi-tenancy K8s : REX Ubisoft - Quand et comment partager un cluster : retour d’expérience sur Capsule
Pour son environnement K8s à grande échelle utilisé par de nombreuses équipes, Ubisoft a exploré différentes stratégies de multi-tenancy afin de trouver le bon équilibre entre isolation, coûts et simplicité opérationnelle.
Dans ce retour d’expérience ils nous présentent le modèle retenu qui repose sur plusieurs niveaux de mutualisation, allant du cluster dédié à des environnements partagés entre les équipes. L’utilisation de Capsule permet de structurer cette approche avec des mécanismes d’isolation et une expérience proche de celle d’un cluster dédié.
Ce retour d’expérience met aussi en lumière que pour construire une plateforme de qualité, il est essentiel de trouver le bon niveau d’abstraction et d’éviter la sur-complexité pour embarquer les utilisateurs.
Lien vers le replay.
Intervenants : Vincent Behar et Corentin Closs (Ubisoft).
🧱 Résilience Kubernetes : Sécurisez vos déploiements : quand kube-image-keeper sauve la prod !
Difficile pour nous de ne pas évoquer dans ce top le talk présenté par notre cher Paul sur l’un de nos outils open source les plus adoptés par la communauté cloud native : kube-image-keeper.
Tout part d’un constat assez simple, mais souvent sous-estimé et encore non adressé globalement : la dépendance aux registries. Il suffit en effet d’une indisponibilité, d’un rate limit dépassé ou d’une image supprimée sur la registry pour que des déploiements pourtant valides échouent, empêchant des mises à jour des applications ou entraînant potentiellement des indisponibilités de service.
Pour répondre à ce type de situations, nous avons développé cet outil avec l’idée d’assurer la disponibilité des images en continu. Ce talk a été l’occasion de partager les évolutions implémentées dans notre v2 pour simplifier son adoption et étendre ses cas d’usage. Kuik v2 embarque trois fonctionnalités principales :
- Le monitoring des images
- La capacité à répliquer les images sur plusieurs sources
- La capacité de bascule automatique si nécessaire, de manière transparente pour les workloads.
Nous pensons que rendre systématique l’utilisation de plusieurs registries est une bonne pratique qui devrait se généraliser. Kuik est une réponse qui nous semble pertinente et nous avons prévu de la porter plus encore dans les mois à venir. Bon visionnage en attendant !
Lien vers le replay.
Intervenants : Paul Laffitte (Enix).
🏗️ Platform Engineering : REX Renault - Kubernetes as a Service : sécurité, innovation et self-service à grande échelle
Comment généraliser l’usage de Kubernetes au sein d’une grande organisation sans trop démultiplier la complexité ?
Arrivé aux limites de son modèle initial mutualisé, Renault nous présente dans ce beau RETEX comment ils ont transformé leur plateforme Kubernetes en produit. Le control plane “API-first” présenté permet de provisionner des clusters et des namespaces en self-service.
Ce qui nous semble particulièrement intéressant dans ce talk, c’est le respect des bonnes pratiques et des “standards” des équipes infrastructure de Renault appliqués automatiquement dans le déploiement des différents clusters K8s (sécurité, observabilité ou même FinOps) … tout en tenant compte en priorité de l’expérience utilisateur.
Lien vers le replay.
Intervenants : Vincent Ledan et Ismail Kaboubi (Renault).
📊 Observabilité : REX Winamax - De zéro à des milliards de traces : le tracing distribué chez Winamax
Dans un environnement comme celui de Winamax, où les volumes et les pics de charge sont particulièrement élevés, les approches classiques basées sur les logs peuvent rapidement montrer leurs limites.
Dans ce REX qui nous a beaucoup plu, les équipes Winamax nous présentent leur adoption du tracing distribué via OpenTelemetry pour suivre des requêtes de bout en bout, en traversant l’ensemble des services impliqués. Couplée à une architecture capable d’absorber des volumes massifs (Kafka, Quickwit, Jaeger), cette approche transforme radicalement leur manière de diagnostiquer les incidents.
Selon eux, là où plusieurs heures étaient parfois nécessaires auparavant, quelques secondes suffisent désormais pour identifier une anomalie ou une latence.
Lien vers le replay.
Intervenants : Anthony Maffert et Nicolas Fidel (Winamax).
Cette sélection a été particulièrement difficile tant la programmation de 2026 était de qualité. Ce talk autour de la sécurité “Admission Control 2.0 : des Webhooks aux politiques intégrées” sont passés tout près du top 10 !” sortait selon nous également du lot, ou encore celui de Raphaël Pinson qui révèle en détail la célèbre plateforme de lab Cilium “Formation à l’échelle : 100 000 sessions de labs réseau & sécurité cloud-native”.
En bonus : deux talks vertueux !
🧠 SRE sous pression : santé mentale, charge invisible et fatigue du “héros de la prod”
Ce talk de Luckas Bosch (podcast “La tangente”) est selon nous un des tous meilleurs de la journée. On sort des problématiques purement techniques et on aborde avec intelligence le sujet sensible de la pression et du stress porté par les équipes techniques opérationnelles.
La charge invisible, les efforts de prévention non valorisés ou encore la culture du “héros” peuvent fortement impacter les personnes, avec parfois des déséquilibres graves sur la durée. C’est le rôle de chacun d’être vigilant pour soi et pour ses collaborateurs, on se croit souvent à l’abri alors que ce sujet peut clairement nous concerner tous…
Luckas nous rappelle que les ingénieurs ne sont pas des ressources interchangeables. Leur fatigue, leur engagement et leur reconnaissance influencent directement la fiabilité du système et au final aussi la bonne opération des plateformes.
Notre cher Jérôme Petazzoni avait donné un talk sur le même sujet évoquant son burn-out lorsqu’il était chez Docker. A l’époque, le sujet était encore tabou, ce talk avait donc beaucoup fait parler et il est encore souvent mentionné dans nos discussions entre tech.
Lien vers le replay.
Intervenants : Luckas Bosch (La Tangente Podcast).
🌱 Passons au Cloud Native durable
Un autre talk intéressant de la journée qui aborde la tech non pas sous l’angle de la performance, de la scalabilité ou autre coûts … mais sous un angle vertueux : la question de l’impact environnemental de nos plateformes.
Entre cloud à la demande et explosion des usages IA, on consomme de plus en plus… souvent sans trop visualiser ce qu’il en découle. L’idée ici n’est pas de culpabiliser, mais plutôt de montrer qu’il existe des solutions et leviers très concrets à mettre en œuvre côté plateforme.
Nous avons aimé le côté très concret des solutions évoquées sous ces angles :
- bien mesurer (avec Kepler)
- intégrer l’énergie comme un vrai KPI dans les pipelines
- optimiser les allocations Kubernetes (requests/limits)
- ou encore éteindre les environnements inutilisés avec Kube Green.
Merci Henrik pour ce beau panorama utile, même si la question de l’écologie nous concerne particulièrement chez Enix, nous ne connaissions pas tous ces outils !
Lien vers le replay.
Intervenants : Henrik Rexed (Dynatrace).
Conclusions
À travers ces conférences de 2026, une évolution se dessine assez nettement depuis l’édition 2023 de KCD France : une adoption désormais très étendue de Kubernetes au sein d’organisations de toutes tailles et de toutes industries, avec de nouvelles problématiques complexes, par exemple liées au passage à l’échelle, ou pour répondre aux besoins de plateformes à la demande, ou encore autour de la sécurité.
Les discussions ne se limitent plus aux outils ou aux bonnes pratiques techniques autour de Kubernetes, elles couvrent de plus en plus la manière de concevoir, d’opérer et de faire évoluer des systèmes cloud native dans leur ensemble, avec les nombreuses stacks bien connues du landscape CNCF.
Qu’il s’agisse de construire un cloud on-premise, de gérer des milliers de bases de données, de sécuriser des accès ou de rendre observable des systèmes distribués, les sujets dépassent aussi souvent le cadre strictement technique. Ils soulèvent des questions connexes, par exemple organisationnelles avec des enjeux humains, ou autour de l’autonomie numérique (sur la portabilité des systèmes, la gestion des données, etc.).
Dans ces talks, beaucoup de matière utile pour nourrir les réflexions et challenger ses propres pratiques. En attendant la prochaine édition 2027 ?
Si vous souhaitez aller plus loin, vous pouvez (re)voir d’autres conférences sur cette playlist avec tous les replays.
Ne ratez pas nos prochains articles DevOps et Cloud Native! Suivez Enix sur Linkedin!