Résultats

Publié par Loic Divad

Il y a 3 semaines

Kafka Streams, le co-partitioning en images et en couleurs

Kafka Streams est la bibliothèque de stream processing proposée par Apache Kafka. Elle permet la transformation à la volé de flux continus. Avec cette bibliothèque il est possible d’atteindre de très faibles latences. Parmi toutes les transformations classiques réalisables (filtres, aggrégations etc) on retrouve les jointures. Il y a un concept essentiel en Kafka Streams...

Il y a 4 semaines

Attaquer des modèles de machine learning : les grands types d’attaques

Peut-on faire révéler ses secrets à un modèle de machine learning ? Et si oui, comment se prémunir d’une telle attaque ? Les modèles de machine learning sont susceptibles d’utiliser des données privées et parfois sensibles, par exemple des informations précises sur des personnes (association nom/photo, habitudes et préférences, etc.). L’évolution des techniques et des...

Publié par Romain Ardiet

Il y a 1 mois

Packaging Python : setup.py et setuptools

Bien que Python soit aujourd’hui extrêmement populaire il y a une facette de celui-ci qui semble toujours peu maitrisée par les développeurs qui l’utilisent : le packaging de code. Hors le packaging est une étape importante lorsque l’on veut partager et réutiliser du code sans avoir à le dupliquer dans chacun de nos projets. Nous...

Publié par Lisa Thevenon

Il y a 2 mois

DataXDay devient DataXDays !

Au vu de la situation actuelle, le DataXDay comme on le connaissait, ne pouvait hélas pas avoir lieu. Nous vous proposons donc un format alternatif appelé DataXDays ! Cet événement gratuit est un ensemble de conférences en remote autour de la Data. Rencontrez nos speakers, tous les mardis de juin – à partir de 13 h...

Il y a 3 mois

Reinforcement learning, les outils : RL Coach

  Introduction Le reinforcement learning (apprentissage par renforcement) est une méthode d’apprentissage machine permettant de réaliser des tâches complexes de façon autonome. Ces algorithmes ont un fort potentiel mais s’avèrent parfois très longs à construire et paramétrer. Avant de démarrer un projet utilisant des algorithmes de reinforcement learning, il est donc utile de s’entourer d’outils...

Publié par Daria Nguyen

Il y a 3 mois

Créez et exécutez votre premier pipeline avec Kubeflow

Cet article est le 3ème d’une série d’articles autour de Kubeflow. Les deux premiers articles ont expliqué comment installer Kubeflow Pipelines sur Google Cloud Platform et vous ont donné un aperçu de la plateforme Kubeflow Pipelines. Et maintenant, c’est le moment de créer votre propre pipeline et d’exécuter votre premier experiment. Quand vous développez et...

Publié par Raphael Matusiak

Il y a 3 mois

COVID19 : entre vulgarisation et modélisation

Cet article traite du COVID-19, des infections virales et des épidémies. Ayant travaillé en tant qu’ingénieur d’études dans un laboratoire académique en neuroscience pendant plusieurs années, j’ai souhaité vous partager quelques explications simples et accessibles sur les virus, leurs origines et leurs mécanismes. L’objectif n’est pas de faire un exposé exhaustif mais de vulgariser certains...

Publié par Vincent Villet

Il y a 3 mois

Automatiser la mise à jour des données dans Google Sheets grâce à Big Query et Google App Script

Le besoin de suivi en temps réel d’indicateurs issus de données ouvertes n’est pas nouveau, mais se fait sentir de façon plus aigüe en cette période de crise sanitaire. Aujourd’hui de nombreux projets permettent de visualiser l’évolution de la propagation du Covid-19 en temps réel, mais ne permettent pas forcément de faire toutes les opérations...

Publié par Vincent Villet

Il y a 3 mois

L’analyse de séries temporelles avec Prophet et DeepAR

Lors de la Xebicon 2019, Sameh Ben Fredj et moi-même avons présenté un talk autour de Prophet et DeepAR, deux librairies open source permettant de simplifier grandement les analyses de séries temporelles. Cet article a pour but de résumer le contenu de ce talk et de présenter ses principales idées. Le code ayant servi à...

Publié par Bertrand Dechoux

Il y a 4 mois

Découvrons KubeFlow… Pipelines

Vous avez installé KubeFlow, par exemple avec GCP car c’est trivial. Et maintenant, vous êtes perdus dans l’interface. Pas de panique, nous allons parcourir tout cela ensemble. Durant le précédent article, vous êtes arrivés à créer une instance KubeFlow. Nous allons maintenant voir la suite, une fois que vous avez cliqué sur “ouvrir le tableau...

Publié par Bertrand Dechoux

Il y a 4 mois

Installer KubeFlow avec GCP ? Trivial !

Apprendre un modèle prédictif est en général une étape bien maîtrisée. La majorité des problèmes se situe plus sur la définition du besoin et sur la capacité de valider des hypothèses grâce à une industrialisation suffisante. En effet, ces deux étapes sont nécessaires afin d’itérer sur votre produit data. Nous allons ici faire un focus...

Il y a 4 mois

TechAway – Découvrez nos BBL 100% remote !

Ça y est, nous sommes confinés. Pour la plupart d’entre nous, c’est télétravail obligatoire et distanciation sociale volontaire. Et les nouvelles peu réjouissantes continuent à s’empiler : annulation du Knowledge Exchange Day d’avril, suspensions et annulations de mission en pagaille (et donc intercontrat forcé…). Pour nous, Sapients, qui sommes friands de partage, d’échanges permanents, l’idée...

Il y a 4 mois

Découvrez l’envers du décor de XebiKart, la keynote de la XebiCon

Lors de la Keynote d’ouverture de la XebiCon’19, nous vous avons présenté la société fictive 4Wheels, constructeur de voitures innovantes. À travers son histoire de 1989 à 2049, nous vous parlons Réalité Augmentée, DataViz, Intelligence artificielle, product management, Agilité, Kubernetes et bien d’autres sujets.   Pour découvrir l’envers du décors de cette keynote, et appréhender...

Publié par Daria Nguyen

Il y a 4 mois

Comment déployer votre propre modèle ML sur GCP en 5 étapes simples

Un jour, vous êtes confronté à la nécessité de déployer votre propre modèle ML sur GCP. À première vue, vous pouvez supposer que Google Cloud Platform (GCP) n’est pas très convivial pour les modèles externes construits avec sklearn ou xgboost, car ils ne sont pas «natifs de Google». Et même si vous devez déployer un...

Publié par Raphael Matusiak

Il y a 4 mois

L’Ethique dans le Big Data

Depuis les années 2014-2015, le secteur de l’intelligence artificielle est en plein essor. Beaucoup d’entreprises souhaitent rentabiliser les données qu’elles accumulent en explorant les possibilités apportées par le machine learning. Les opportunités de ces nouvelles technologies sont immenses et de nombreuses innovations voient le jour très régulièrement. Toutefois, l’utilisation de ces données n’est pas anodine,...

Publié par Johan Jublanc

Il y a 5 mois

Reinforcement learning, partie 2 : one step deeper

    Introduction : Le reinforcement learning (apprentissage par renforcement) est une méthode d’apprentissage machine permettant de réaliser des tâches complexes de façon autonome. Encore récemment, cette famille d’algorithmes a fait parler d’elle dans le domaine de l’e-sport lors de la sortie d’AlphaStar, algorithme développé par DeepMind pour défier les meilleurs joueurs du monde à...

Il y a 5 mois

Spark On K8S with S3? How we made it work!

Lors de la XebiCon’19, Sergio Dos Santos et Guillaume Albini, Consultants chez Publicis Sapient Engineering ont présenté la conférence « Spark On K8S with S3? How we made it work! ». Spark, couplé à des solutions de type Object Storage, offre désormais la possibilité d’exécuter des traitements sur un Kubernetes managé sans passer par une distribution lourde...

Il y a 5 mois

L’Ethique du Big Data

Lors de la XebiCon’19, Sandra Pietrowska et Raphaël Matusiak, Data Scientists chez Publicis Sapient Engineering ont présenté la conférence « L’Ethique du Big Data ». La grande majorité des entreprises se lancent avec beaucoup d’effervescence dans de nombreux projets d’innovation Big Data. En parallèle, nous observons de plus en plus de réticence de la part des utilisateurs...

Nous recrutons

Être un Sapient, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.