Articles

Découvrir le cloud avec AWS en développant un data pipeline – Partie 4

Dans la précédente partie de ce tutoriel, nous avons développé ce qui constitue le cœur de notre data pipeline, le job de transformation et d’ingestion de données. Nous avons également découvert une fonctionnalité intéressante d’AWS Glue qui nous permet d’analyser nos fichiers de données afin d’en générer des tables, exposées via un catalogue de données....

Publié par Eren Gundag

Il y a 6 jours

Publié par Bertrand Dechoux

Il y a 3 semaines

Evitez le remote state Terraform entre modules

Dans tout projet non trivial utilisant Terraform, il va être nécessaire de créer des modules et d’être capable de relier ces modules ensemble. Assez rapidement, une data source de type remote state va sans doute être utilisée. Mais bien que simple d’utilisation, cela a des implications sur la sécurité. C’est ce que nous allons voir...

Publié par Eren Gundag

Il y a 2 mois

Découvrir le cloud avec AWS en développant un data pipeline – Partie 3

Dans la précédente partie de ce tutoriel, nous avons construit la première étape de notre data pipeline : son déclenchement à l’arrivée des fichiers de données, ainsi qu’un prétraitement des données. Cette étape a été l’occasion pour nous de découvrir AWS Lambda qui nous permet d’exécuter notre code sans se soucier de l’infrastructure à déployer...

Publié par Vincent Villet

Il y a 2 mois

Faire un export JSON valid depuis BigQuery grâce à Apache Beam et Dataflow

BigQuery est le data warehouse serverless de Google Cloud Platform qui permet d’analyser de très larges volumes de données en un minimum de temps. Ses hautes performances limitent néanmoins ses options d’export de données, ce qui peut être problématique si le système consommateur des données d’export a besoin d’un formatage bien précis. J’ai été confronté...

Publié par Vincent Villet

Il y a 4 mois

Tackling Green IT for business opportunities

Lors de cette nouvelle édition de Vivatech, Vincent Villet et Lorraine de Montenay ont échangé sur l’intérêt pour les entreprises d’investir dans le développement numérique responsable. En plus d’anticiper la régulation à venir, les entreprises doivent dès à présent entreprendre des démarches sur ce sujet clé pour devancer leurs concurrents par l’amélioration de l’expérience utilisateur, l’augmentation de...

Il y a 4 mois

Des interfaces sur mesure avec le CMS Contentful – épisode 1 : CMS Headless, Contentful et ses UI Extensions

Avec l’évolution des contenus web a émergé un type de CMS dit “Headless”, adapté à de nouveau mode de création et d’architecture parmi lesquelles on compte par exemple la Jamstack. Rapidité, simplicité et efficacité. Dans ce contexte, ces mots ont pris tout leur sens, tant en termes de processus de création que de réalisation. Les...

Publié par Eren Gundag

Il y a 5 mois

Découvrir le cloud avec AWS en développant un data pipeline Partie 2

Dans la première partie de ce tutoriel, nous avons présenté brièvement les principes d’un service de cloud computing comme AWS et certains de ses avantages puis avons fait nos premiers pas dans la console. Nous avons ensuite découvert l’un des services les plus emblématiques d’AWS, Amazon S3, service de stockage orienté objet, à travers la...

Il y a 5 mois

Le DataXDay revient le 24 juin prochain !

100% HYBRIDE, 100% POUR ET PAR LES DATA LOVERS Save the date : 24 juin 2021 Il sera possible d’y assister soit sur place à Paris, soit directement de chez vous via une plateforme dédiée ! L’événement s’adapte ainsi à vos envies et permet de vous offrir une expérience optimale, dans le respect des règles...

Il y a 5 mois

Animer la co-construction des solutions

Les individus et les interactions plutôt que les processus et les outils. C’est par cette simple phrase que commence le Manifeste agile. Mais que devient cette assertion dans la situation sanitaire que nous connaissons tous depuis 2020 et qui continue en 2021 ? Le développement du télétravail nous amène inéluctablement à réviser nos pratiques agiles....

Publié par Franck Cussac

Il y a 5 mois

Kubernetes Event-driven Autoscaling (KEDA)

Sur Kubernetes, vous pouvez scale automatiquement vos Deployments grâce aux Horizontal Pod Autoscaler (HPA). Les HPA se basent sur la consommation en CPU et en mémoire des Pods de votre Deployment pour augmenter ou réduire son nombre de réplicas. Maintenant, supposons que nous souhaitions autoscale un consumer Kafka. À la XebiCon 2018, nous vous présentions...

Publié par Antoine Marcou

Il y a 5 mois

GreenIT is the new RGPD : ne vous laissez pas distancer

GreenIT, Numérique Responsable, Sobriété Numérique. Peu importe le nom qu’on lui donne, habituons-nous à ce mouvement dont nous serons toutes et tous familiers d’ici peu, si ce n’est pas déjà le cas. Je ne me fais pas ici l’écho des chiffres traduisant l’urgence climatique. Nous vivons un moment charnière, c’est indiscutable. Et la pollution numérique,...

Il y a 6 mois

KubeCon + CloudNativeCon EU 2021 – C’est parti ! Welcome & Jour 1

Lors des trois précédentes éditions, en 2018, 2019 et 2020, nous vous avions partagé l’expérience qu’a été chaque KubeCon + CloudNativeCon Europe sur ce même blog : KCCNC EU 2018 @ Copenhague KubeCon + CloudNativeCon EU 2018 – Day 0 KubeCon + CloudNativeCon EU 2018 – Day 1 KubeCon + CloudNativeCon EU 2018 – Day 2 KubeCon +...

Publié par Benoit de Pompignan

Il y a 6 mois

Refaire confiance en notre intelligence

Analyser la complexité d’une entreprise au travers d’une simple suite de chiffre ou d’un modèle m’a toujours paru être insuffisant. Dernièrement, l’intelligence artificielle aurait plutôt tendance à me donner raison. “Tous les modèles sont faux, mais certains sont utiles” Dès qu’on aborde une problématique complexe, il est difficile d’avoir des modèles qui prennent en compte...

Publié par Eren Gundag

Il y a 6 mois

Découvrir le cloud avec AWS en développant un data pipeline – Partie 1

Vous souhaitez découvrir le cloud mais ne savez pas par où commencer : les concepts et façons de travailler diffèrent de ceux dont vous avez l’habitude; les sites d’AWS (Amazon Web Services), GCP (Google Cloud Platform) ou encore Microsoft Azure présentent une longue liste de produits aux noms pas toujours parlants; vous craignez que votre...

Il y a 6 mois

La sprint review à distance

Les individus et les interactions plutôt que les processus et les outils. C’est par cette simple phrase que commence le Manifeste agile. Mais que devient cette assertion dans la situation sanitaire que nous connaissons tous depuis 2020 et qui continue en 2021 ? Le développement du télétravail nous amène inéluctablement à réviser nos pratiques agiles. Finis...

Il y a 6 mois

Le Paris Container Day revient le 3 juin prochain !

Le Paris Container Day est de retour pour une nouvelle édition le jeudi 3 juin 2021 ! PRENEZ DÈS MAINTENANT VOTRE BILLET !  Le thème de cette année, revenir à la base : les conteneurs ! Cette édition s’articulera autour de 2 thèmes : un dédié au Build d’images de conteneurs, et l’autre à la partie...

Publié par Olivier Marquet

Il y a 6 mois

La seconde édition du Guide des Communautés de Pratique en Pratique, est disponible !

La seconde édition du Guide des Communautés de Pratique en Pratique, est disponible !   Pourquoi ce guide ? Les transformations numériques sont partout. L’agilité est reconnue comme un vecteur majeur de réussite. Après 10 années de transformations agiles d’équipes et de programmes, il semble évident que cette transformation doit passer par celle de l’entreprise....

Il y a 7 mois

Docteur, j’ai commité 8 Go dans mon Git. C’est grave ?

Dans cet article, nous allons voir les conséquences de commiter de trop gros fichiers sur un dépôt Git et surtout une solution pour y remédier. Histoire Derrière ce titre délibérément provocateur se cache une situation réelle que nous avons vécue sur un projet de développement d’une Plateforme Data Science pour une grande entreprise pharmaceutique française....

Nous recrutons

Être un Sapient, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.