L'auteur
Description de l'auteur
Articles
Il y a 3 ans
Kafka Streams, le co-partitioning en images et en couleurs
Kafka Streams est la bibliothèque de stream processing proposée par Apache Kafka. Elle permet la transformation à la volé de flux continus. Avec cette bibliothèque il est possible d’atteindre de très faibles latences. Parmi toutes les transformations classiques réalisables (filtres, aggrégations etc) on retrouve les jointures. Il y a un concept essentiel en Kafka Streams...
Il y a 3 ans
Contes et légendes autour de l’entreprise temps réel
Lors de la XebiCon’19, Loïc Divad, Data Engineer chez Publicis Sapient Engineering a présenté la conférence « Contes et légendes autour de l’entreprise temps réel ». La vie de votre business est faite d’une suite d’événements. Une jolie maxime qui ne colle pas avec la réalité de la plupart des systèmes d’information. Les usages poussent de plus...
Il y a 3 ans
Event Driven Machine Learning
Lors de la XebiCon’19, Giulia Bianchi, Data Scientist et Loic Divad, Data Engineer chez Publicis Sapient Engineering ont présenté la conférence « Event Driven Machine Learning« . Le serving de modèle de Machine Learning pour la prédiction en temps réel présente des défis tant en Data Engineering qu’en Data Science. Comment construire un pipeline moderne qui permet...
Il y a 3 ans
Kafka Summit San Francisco 2019: Streaming platforms at massive scale
Kafka Summit, c’est l’événement où se réunissent les contributeurs, utilisateurs et passionnés d’Apache Kafka. Je vous en avais déjà parlé dans mon article sur l’édition européenne de 2019. J’ai eu la chance d’assister à cette dernière qui se tenait à Londres (merci @XebiaFr =P). Je pensais donc avoir eu mon compte pour l’année. C’était sans...
Il y a 4 ans
What (data) lovers do
L’année dernière, la première édition du DataXDay a été un franc succès. Alors nous ne voulions pas nous arrêter là, nous sommes repartis pour une seconde édition le 27 juin prochain ! Nous avons démarré cette nouvelle aventure il y a quelques mois déjà, et nous vous proposons un bilan de notre avancement. Cet article...
Il y a 4 ans
Data Lovers, découvrez le programme du DataXDay !
DataXDay, LA conférence technique Data organisée par Xebia et Publicis Sapient, est dans un mois ! Data Lovers, nous sommes impatients de vous y retrouver. Si vous n’avez pas encore votre place, il est encore temps de profiter du tarif Early Bird à 70 euros seulement. Venez, donc durant la journée, assembler les différents blocs...
Il y a 4 ans
Kafka Summit London 2019: Streaming platforms at massive scale
Lundi Event Streaming: Our Cloud-Native Journey Lessons – Neha Narkhede Experiences Operating Apache Kafka at Scale – Noa Resare Everything You Always Wanted to Know About Kafka’s Rebalance Protocol but Were Afraid to Ask – Matthias J. Sax Mardi Show Me Kafka Tools That Will Increase My Productivity! – Stéphane Maarek Performance Analysis and Optimizations...
Il y a 4 ans
Kafka-Streams : une voie vers l’autoscaling avec Kubernetes
Kafka-Streams est la bibliothèque de stream processing associée à la streaming platform Apache Kafka. Kafka vient donc en plusieurs parties avec notamment : une partie persistance (core) qui donne la faculté de publier et consommer des messages, puis une partie traitement (streams) qui rend possible le traitement à la volée de ces messages. Kafka-Streams a...
Il y a 4 ans
Kafka-Streams: a road to autoscaling via Kubernetes
Kafka-Streams is the stream processing library included in Apache Kafka, a streaming data platform. Because Kafka-Streams is a simple library, and not a framework, it’s used by applications that can be deployed and run in many ways. This article aims to present a few advantages that come with specific practices like containerization and orchestration, and especially autoscaling. Kafka-Streams...
Il y a 4 ans
Meetup Paris Scala User Group – Recursion Schemes
Xebia a le plaisir d’accueillir le Meetup PSUG pour une session autour des recursion schemes, le jeudi 28 Février de 19h à 21h. Au programme : Virgile Quintin et Nicolas François nous présenteront les recursions schemes Kévin Rauscher donnera sa présentation Scala Schemas with Shapeless Inscrivez-vous et venez nombreux au 7e étage du 156...
Il y a 4 ans
Deux Data Lovers au Spark+AI Summit Europe 2018
Apache Spark, initialement développé à l’université de Californie à Berkeley par AMPLab, est un framework de traitement de données distribuées pour effectuer des analyses complexes à grande échelle. Dans un écosystème riche, il a su se hisser parmi les produits les plus utilisés en Big Data. Il a permis de nombreuses avancées pour la recherche...
Il y a 5 ans
Le 2 mai, Xebia organise un Tech Event Data on GCP
Nous avons le plaisir d’annoncer le lancement de la soirée Tech Event « Data sur Google Cloud ». L’objectif est de se réunir autour d’un hands-on mélangeant développement et cloud. Il s’agit d’un atelier pratique pour vous permettre de découvrir une technologie Google Cloud. Un hands-on centré sur Cloud ML L’atelier proposé se concentrera sur Cloud ML, un...
Il y a 6 ans
Apache Kudu : la nouvelle antilope des architectures Big Data
Apache Kudu est un système de stockage distribué qui vient s’ajouter aux outils de la suite Hadoop. Le projet a été initié par les équipes de Cloudera et est spécialement conçu pour combler l’écart de performance entre HDFS et les bases de données colonnes. Cet outil est relativement jeune et vient se confronter à un...
Nous recrutons
Être un Sapient, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.