Articles

Découvrir le cloud avec AWS en développant un data pipeline – Partie 3

Dans la précédente partie de ce tutoriel, nous avons construit la première étape de notre data pipeline : son déclenchement à l’arrivée des fichiers de données, ainsi qu’un prétraitement des données. Cette étape a été l’occasion pour nous de découvrir AWS Lambda qui nous permet d’exécuter notre code sans se soucier de l’infrastructure à déployer...

Publié par Eren Gundag

Il y a 4 semaines

Publié par Vincent Villet

Il y a 1 mois

Faire un export JSON valid depuis BigQuery grâce à Apache Beam et Dataflow

BigQuery est le data warehouse serverless de Google Cloud Platform qui permet d’analyser de très larges volumes de données en un minimum de temps. Ses hautes performances limitent néanmoins ses options d’export de données, ce qui peut être problématique si le système consommateur des données d’export a besoin d’un formatage bien précis. J’ai été confronté...

Publié par Vincent Villet

Il y a 3 mois

Tackling Green IT for business opportunities

Lors de cette nouvelle édition de Vivatech, Vincent Villet et Lorraine de Montenay ont échangé sur l’intérêt pour les entreprises d’investir dans le développement numérique responsable. En plus d’anticiper la régulation à venir, les entreprises doivent dès à présent entreprendre des démarches sur ce sujet clé pour devancer leurs concurrents par l’amélioration de l’expérience utilisateur, l’augmentation de...

Il y a 3 mois

Des interfaces sur mesure avec le CMS Contentful – épisode 1 : CMS Headless, Contentful et ses UI Extensions

Avec l’évolution des contenus web a émergé un type de CMS dit “Headless”, adapté à de nouveau mode de création et d’architecture parmi lesquelles on compte par exemple la Jamstack. Rapidité, simplicité et efficacité. Dans ce contexte, ces mots ont pris tout leur sens, tant en termes de processus de création que de réalisation. Les...

Publié par Eren Gundag

Il y a 4 mois

Découvrir le cloud avec AWS en développant un data pipeline Partie 2

Dans la première partie de ce tutoriel, nous avons présenté brièvement les principes d’un service de cloud computing comme AWS et certains de ses avantages puis avons fait nos premiers pas dans la console. Nous avons ensuite découvert l’un des services les plus emblématiques d’AWS, Amazon S3, service de stockage orienté objet, à travers la...

Il y a 4 mois

Le DataXDay revient le 24 juin prochain !

100% HYBRIDE, 100% POUR ET PAR LES DATA LOVERS Save the date : 24 juin 2021 Il sera possible d’y assister soit sur place à Paris, soit directement de chez vous via une plateforme dédiée ! L’événement s’adapte ainsi à vos envies et permet de vous offrir une expérience optimale, dans le respect des règles...

Il y a 4 mois

Animer la co-construction des solutions

Les individus et les interactions plutôt que les processus et les outils. C’est par cette simple phrase que commence le Manifeste agile. Mais que devient cette assertion dans la situation sanitaire que nous connaissons tous depuis 2020 et qui continue en 2021 ? Le développement du télétravail nous amène inéluctablement à réviser nos pratiques agiles....

Publié par Franck Cussac

Il y a 4 mois

Kubernetes Event-driven Autoscaling (KEDA)

Sur Kubernetes, vous pouvez scale automatiquement vos Deployments grâce aux Horizontal Pod Autoscaler (HPA). Les HPA se basent sur la consommation en CPU et en mémoire des Pods de votre Deployment pour augmenter ou réduire son nombre de réplicas. Maintenant, supposons que nous souhaitions autoscale un consumer Kafka. À la XebiCon 2018, nous vous présentions...

Publié par Antoine Marcou

Il y a 5 mois

GreenIT is the new RGPD : ne vous laissez pas distancer

GreenIT, Numérique Responsable, Sobriété Numérique. Peu importe le nom qu’on lui donne, habituons-nous à ce mouvement dont nous serons toutes et tous familiers d’ici peu, si ce n’est pas déjà le cas. Je ne me fais pas ici l’écho des chiffres traduisant l’urgence climatique. Nous vivons un moment charnière, c’est indiscutable. Et la pollution numérique,...

Il y a 5 mois

KubeCon + CloudNativeCon EU 2021 – C’est parti ! Welcome & Jour 1

Lors des trois précédentes éditions, en 2018, 2019 et 2020, nous vous avions partagé l’expérience qu’a été chaque KubeCon + CloudNativeCon Europe sur ce même blog : KCCNC EU 2018 @ Copenhague KubeCon + CloudNativeCon EU 2018 – Day 0 KubeCon + CloudNativeCon EU 2018 – Day 1 KubeCon + CloudNativeCon EU 2018 – Day 2 KubeCon +...

Publié par Benoit de Pompignan

Il y a 5 mois

Refaire confiance en notre intelligence

Analyser la complexité d’une entreprise au travers d’une simple suite de chiffre ou d’un modèle m’a toujours paru être insuffisant. Dernièrement, l’intelligence artificielle aurait plutôt tendance à me donner raison. “Tous les modèles sont faux, mais certains sont utiles” Dès qu’on aborde une problématique complexe, il est difficile d’avoir des modèles qui prennent en compte...

Publié par Eren Gundag

Il y a 5 mois

Découvrir le cloud avec AWS en développant un data pipeline – Partie 1

Vous souhaitez découvrir le cloud mais ne savez pas par où commencer : les concepts et façons de travailler diffèrent de ceux dont vous avez l’habitude; les sites d’AWS (Amazon Web Services), GCP (Google Cloud Platform) ou encore Microsoft Azure présentent une longue liste de produits aux noms pas toujours parlants; vous craignez que votre...

Il y a 5 mois

La sprint review à distance

Les individus et les interactions plutôt que les processus et les outils. C’est par cette simple phrase que commence le Manifeste agile. Mais que devient cette assertion dans la situation sanitaire que nous connaissons tous depuis 2020 et qui continue en 2021 ? Le développement du télétravail nous amène inéluctablement à réviser nos pratiques agiles. Finis...

Il y a 5 mois

Le Paris Container Day revient le 3 juin prochain !

Le Paris Container Day est de retour pour une nouvelle édition le jeudi 3 juin 2021 ! PRENEZ DÈS MAINTENANT VOTRE BILLET !  Le thème de cette année, revenir à la base : les conteneurs ! Cette édition s’articulera autour de 2 thèmes : un dédié au Build d’images de conteneurs, et l’autre à la partie...

Publié par Olivier Marquet

Il y a 6 mois

La seconde édition du Guide des Communautés de Pratique en Pratique, est disponible !

La seconde édition du Guide des Communautés de Pratique en Pratique, est disponible !   Pourquoi ce guide ? Les transformations numériques sont partout. L’agilité est reconnue comme un vecteur majeur de réussite. Après 10 années de transformations agiles d’équipes et de programmes, il semble évident que cette transformation doit passer par celle de l’entreprise....

Il y a 6 mois

Docteur, j’ai commité 8 Go dans mon Git. C’est grave ?

Dans cet article, nous allons voir les conséquences de commiter de trop gros fichiers sur un dépôt Git et surtout une solution pour y remédier. Histoire Derrière ce titre délibérément provocateur se cache une situation réelle que nous avons vécue sur un projet de développement d’une Plateforme Data Science pour une grande entreprise pharmaceutique française....

Publié par Romain Benassi

Il y a 6 mois

NLP : concepts clés et état de l’art

L’objectif de cet article est de s’arrêter sur quelques notions clés intervenant dans le domaine du NLP (Natural Language Processing) et de montrer la façon dont celles-ci s’agencent pour amener à l’état de l’art actuel, en particulier dans le cadre des approches deep learning. L’ambition ici n’est pas de rentrer dans le détail des équations...

Publié par Oleksandr Slynko

Il y a 7 mois

Java est sur le point de devenir pauseless (Z Garbage Collector)

Introduction Depuis Java 11, il y avait une fonctionnalité expérimentale qui est récemment devenue prête pour la production dans la 15e version de Java. Cette fonctionnalité mérite plus d’attention aujourd’hui, on souhaite donc la souligner. La version contient un garbage collector ultra-rapide, ZGC, qui est développé par Oracle et qui promet des temps de pause...

Nous recrutons

Être un Sapient, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.