SysadminDays est une conférence technique dédiée aux métiers de l'administration système.
Cette neuvième édition a eu lieu à Paris, les lundi 18 et mardi 19 Novembre 2019.
La gestion d'incident est un moment très complexe et sous pression dans la vie d'un SRE, les gérer au mieux implique une organisation rigoureuse.
Retours d'expériences concrets sur ce qu'on vit et ce qu'on a appris à Synthesio, et comment cette culture influence notre organisation du travail au jour le jour, et même intéresse toutes les entités de l'entreprise, y compris les non-techniques.
Il sera question de gestion du temps, de la fatigue, de culture blameless, de priorisation des tâches, de postmortems…
Le but est de proposer une conférence un peu alternative, non technique mais adressée à des ingénieurs / techniciens plutôt devops / SRE qui pourraient bénéficier de ces retours d'expérience dans leur gestion du quotidien.
Immutable infrastructure provides more consistency, reliability in our infrastructure and simpler predictable deployment process. It’s the pattern of infrastructure provided by modern PAAS. However this paradigm often requires fast server provisioning in a cloud computing environment and to find solutions to handle ephemeral instances. They create changes in the network layer, which also means changes in the DNS configuration.
This creates new expectations on DNS servers, and this can create a risk where no more services will be able to communicate through the network.
Solutions like powerdns and bind don't provide this kind of architecture and they suffer from lack of redundancy, which transforms the DNS architecture in a single point of failure.
In this talk I'll present stream-dns, a DNS server written in Go which is based on an Event Sourcing model, using Kafka/Pulsar as a Sink for the DNS configurations change events.
Il y a deux ans, nous apprenions notre nouvelle mission : migrer les 3 millions de sites web hébergés dans notre datacentre de Paris. Sans en maitriser le code source, les migrer sans impact nous semblait totalement irréaliste.
18 mois plus tard, c'est terminé ! Pour y arriver, nous avons du configurer des proxy SQL, des tunnels réseau, migrer des IP entre nos datacentres, livrer des milliers de serveurs, bosser durant des dizaines de nuits, mais aussi s'organiser entre plusieurs équipes qui n'ont pas l'habitude de travailler ensemble. Quels sont les soucis technique et humains que nous avons rencontrés, et comment les avons nous résolu ? Retour d'expérience sur l'une des plus grosse migration que le web ai connu !
Les ops/l'infra/les SRE partagent beaucoup de pratiques avec les developeurs. On parle énormément d'agilité, de méthodologie mais assez peu de tests. Cette conférence propose de voir à la fois des retours d'expériences, des expérimentations et des sujets de recherche.
Lorsqu'une entreprise se crée, les personnes présentes peuvent utiliser les grandes plateformes de cloud pour lancer le service. Les interfaces web permettent de lancer des services facilement. Une fois la société lancée il appartient de rationaliser ses services. Terraform est une bonne solution pour ce faire. Cette présentation montre l'usage de quelques outils pratiques pour reprendre la main sur ces ressources et en assurer l'évolution.
Ansible est un outil utilisé par de nombreuses entreprise pour gérer leurs configurations et leurs déploiements applicatifs mais comment nous assurer que ces déploiements sont bien réalisés sur les différents systèmes ? Cette présentation montrera Molecule, l'outil de test de playbook/rôle d'Ansible, permettant d'executer ses tests sur les différents providers qu'Ansible propose (Docker, OpenStack, Vagrant…).
D'un côté, la release de ZFS 0.8 apporte son lot de nouvelles fonctionnalités (encryption, device removal…), de l'autre il y a une grande tendance à mutualiser ses volumes sur des devices de plus en plus denses. Comment assurer une sécurité silotée des données sans rendre la maintenance inconfortable ? On vous parle de notre retour d'expérience !
Spring 2017, Kapten's tech team is looking for a tool to deploy and manage their microservices. The quest to find a sharp tool looked gloomy at that time without any existing tool answering all the pressing needs for our knights. Knights of the round table gathered and embraced the challenge to give birth to Nestor. One tool to rule them all!
Nestor is our valiant tool allowing every soul in the tech kingdom to interact with microservices without the need to be a container or orchestration wizard.
Our fearless tech team uses it daily, its goal is simple yet complex: Manage, configure and deploy our audacious microservices stack, which is growing at the speed of light.
OVHcloud utilise Ceph depuis cinq ans pour certains de ses besoins de stockage, bien qu'étant composée de 2000 serveurs physiques et 20000 conteneurs, cette infrastructure est gérée au quotidien par une seule personne au RUN. Nous ferons une présentation et un retour d'expérience sur les différents moyens mis en oeuvre pour y arriver.
Retour d'experience sur la migration des clusters MySQL de "cold storage" de la plateforme Synthesio depuis InnoDB vers MyRocks.
Ces clusters stockent les documents crawlés (tweet, facebook, instagram, reddit, forums, sites…), le tout pour environ ~60To de données.
Qu'est ce que RocksDB, notre use-case et limitations, et pourquoi l'avoir choisi ?
Plusieurs mois de tests, de fails, de migrations, aboutissant à environ 35% d'espace disque gagné, 30% de gain sur les read/writes, le tout (presque) sans changer une ligne de code de l'applicatif !