Sysadmin Days #9

SysadminDays est une conférence technique dédiée aux métiers de l'administration système.

Cette neuvième édition a eu lieu à Paris, les lundi 18 et mardi 19 Novembre 2019.

Présentations

Lundi 18 Novembre

Mot de bienvenue et présentation sponsors

Vidéo

Incident Management and its applications to daily work

Guillaume Estassy Synthesio

La gestion d'incident est un moment très complexe et sous pression dans la vie d'un SRE, les gérer au mieux implique une organisation rigoureuse.

Retours d'expériences concrets sur ce qu'on vit et ce qu'on a appris à Synthesio, et comment cette culture influence notre organisation du travail au jour le jour, et même intéresse toutes les entités de l'entreprise, y compris les non-techniques.

Il sera question de gestion du temps, de la fatigue, de culture blameless, de priorisation des tâches, de postmortems…

Le but est de proposer une conférence un peu alternative, non technique mais adressée à des ingénieurs / techniciens plutôt devops / SRE qui pourraient bénéficier de ces retours d'expérience dans leur gestion du quotidien.

DataPipeline: Kafka, the distributed and scalable UNIX pipe ?

Raphael Mazelier ContentSquare

Présentation d'un data pipeline
Exemple avec celui de ContentSquare
Comparaison de kafka avec le pipe UNIX
Optimisation et supervision de Kafka

Moving our legacy DNS stack to a cloud native, streaming based architecture

Alessio Coltellacci et Laurent Doguin Clever Cloud

Immutable infrastructure provides more consistency, reliability in our infrastructure and simpler predictable deployment process. It’s the pattern of infrastructure provided by modern PAAS. However this paradigm often requires fast server provisioning in a cloud computing environment and to find solutions to handle ephemeral instances. They create changes in the network layer, which also means changes in the DNS configuration.

This creates new expectations on DNS servers, and this can create a risk where no more services will be able to communicate through the network.

Solutions like powerdns and bind don't provide this kind of architecture and they suffer from lack of redundancy, which transforms the DNS architecture in a single point of failure.

In this talk I'll present stream-dns, a DNS server written in Go which is based on an Event Sourcing model, using Kafka/Pulsar as a Sink for the DNS configurations change events.

How we avoid single point of failure thanks to our distributed architecture
How event sourcing helps us to track/log DNS modifications in the system
How DNS metrics produced by stream-dns improve the system’s observability
How streaming makes propagation faster
How it removes most caching issues

Migrer 3 millions de sites sans maitriser leur code source ? Impossible mais vrai !

Vincent Cassé OVHcloud

Il y a deux ans, nous apprenions notre nouvelle mission : migrer les 3 millions de sites web hébergés dans notre datacentre de Paris. Sans en maitriser le code source, les migrer sans impact nous semblait totalement irréaliste.

18 mois plus tard, c'est terminé ! Pour y arriver, nous avons du configurer des proxy SQL, des tunnels réseau, migrer des IP entre nos datacentres, livrer des milliers de serveurs, bosser durant des dizaines de nuits, mais aussi s'organiser entre plusieurs équipes qui n'ont pas l'habitude de travailler ensemble. Quels sont les soucis technique et humains que nous avons rencontrés, et comment les avons nous résolu ? Retour d'expérience sur l'une des plus grosse migration que le web ai connu !

Table-ronde : parlons recrutement

François Aichelbaum Oxeva

Audrey Auber Alterway

Thomas Brette VPTech

Vidéo

Mardi 19 Novembre

Testing in infrastructure

Nicolas Szalai Ledger

Les ops/l'infra/les SRE partagent beaucoup de pratiques avec les developeurs. On parle énormément d'agilité, de méthodologie mais assez peu de tests. Cette conférence propose de voir à la fois des retours d'expériences, des expérimentations et des sujets de recherche.

Flash talk impromptu : Deneir, prémices d'un projet opensource de cartographie automatisée pour microservices

Aurélien Rougemont Synthesio

Vidéo

Kubernetes from scratch at Veepee

Loïc Blot Veepee

Comment partir d'une feuille blanche et monter un cluster Kubernetes from scratch pour faire tourner de la production at scale. Quels sont les problèmes que l'on peut rencontrer, résoudre ou contourner ?

Flash talk : Du cloud en click-click à infrastructure as code sans tout casser (ou presque)

Gaëtan Duchaussois Fretlink

Lorsqu'une entreprise se crée, les personnes présentes peuvent utiliser les grandes plateformes de cloud pour lancer le service. Les interfaces web permettent de lancer des services facilement. Une fois la société lancée il appartient de rationaliser ses services. Terraform est une bonne solution pour ce faire. Cette présentation montre l'usage de quelques outils pratiques pour reprendre la main sur ces ressources et en assurer l'évolution.

Flash talk : Molecule, ou comment tester ses rôles Ansible

Cyril Grosjean Wifirst

Ansible est un outil utilisé par de nombreuses entreprise pour gérer leurs configurations et leurs déploiements applicatifs mais comment nous assurer que ces déploiements sont bien réalisés sur les différents systèmes ? Cette présentation montrera Molecule, l'outil de test de playbook/rôle d'Ansible, permettant d'executer ses tests sur les différents providers qu'Ansible propose (Docker, OpenStack, Vagrant…).

Flash talk : Dompter ses problématiques RGPD à grands coups de ZFS

Alexandre Buisine Enix

D'un côté, la release de ZFS 0.8 apporte son lot de nouvelles fonctionnalités (encryption, device removal…), de l'autre il y a une grande tendance à mutualiser ses volumes sur des devices de plus en plus denses. Comment assurer une sécurité silotée des données sans rendre la maintenance inconfortable ? On vous parle de notre retour d'expérience !

Déploiement et gestion du cycle de vie de micro-services sur Kubernetes avec un outil maison

Saâd Dif Kapten

Spring 2017, Kapten's tech team is looking for a tool to deploy and manage their microservices. The quest to find a sharp tool looked gloomy at that time without any existing tool answering all the pressing needs for our knights. Knights of the round table gathered and embraced the challenge to give birth to Nestor. One tool to rule them all!

Nestor is our valiant tool allowing every soul in the tech kingdom to interact with microservices without the need to be a container or orchestration wizard.

Our fearless tech team uses it daily, its goal is simple yet complex: Manage, configure and deploy our audacious microservices stack, which is growing at the speed of light.

1 sysadmin vs 250 clusters de stockage

Etienne Menguy OVHcloud

OVHcloud utilise Ceph depuis cinq ans pour certains de ses besoins de stockage, bien qu'étant composée de 2000 serveurs physiques et 20000 conteneurs, cette infrastructure est gérée au quotidien par une seule personne au RUN. Nous ferons une présentation et un retour d'expérience sur les différents moyens mis en oeuvre pour y arriver.

MyRocks, a RocksDB storage engine with MySQL

Romain "Skunnyk" Bouvier Synthesio

Retour d'experience sur la migration des clusters MySQL de "cold storage" de la plateforme Synthesio depuis InnoDB vers MyRocks.

Ces clusters stockent les documents crawlés (tweet, facebook, instagram, reddit, forums, sites…), le tout pour environ ~60To de données.

Qu'est ce que RocksDB, notre use-case et limitations, et pourquoi l'avoir choisi ?

Plusieurs mois de tests, de fails, de migrations, aboutissant à environ 35% d'espace disque gagné, 30% de gain sur les read/writes, le tout (presque) sans changer une ligne de code de l'applicatif !