Résultats
Il y a 1 an
Découvrir le cloud avec AWS en développant un data pipeline – Partie 5
Nous arrivons à la dernière partie de ce tutoriel. Nous avons commencé par définir ce qu’est le cloud computing et ce qu’il peut apporter d’intéressant à nos projets. Nous avons ensuite découvert plusieurs services comme Amazon S3, AWS IAM ou AWS Glue autour de la mise en place d’un data pipeline. Ces services sont généralement...
Il y a 1 an
Découvrir le cloud avec AWS en développant un data pipeline – Partie 4
Dans la précédente partie de ce tutoriel, nous avons développé ce qui constitue le cœur de notre data pipeline, le job de transformation et d’ingestion de données. Nous avons également découvert une fonctionnalité intéressante d’AWS Glue qui nous permet d’analyser nos fichiers de données afin d’en générer des tables, exposées via un catalogue de données....
Il y a 2 ans
Découvrir le cloud avec AWS en développant un data pipeline – Partie 3
Dans la précédente partie de ce tutoriel, nous avons construit la première étape de notre data pipeline : son déclenchement à l’arrivée des fichiers de données, ainsi qu’un prétraitement des données. Cette étape a été l’occasion pour nous de découvrir AWS Lambda qui nous permet d’exécuter notre code sans se soucier de l’infrastructure à déployer...
Il y a 2 ans
Faire un export JSON valid depuis BigQuery grâce à Apache Beam et Dataflow
BigQuery est le data warehouse serverless de Google Cloud Platform qui permet d’analyser de très larges volumes de données en un minimum de temps. Ses hautes performances limitent néanmoins ses options d’export de données, ce qui peut être problématique si le système consommateur des données d’export a besoin d’un formatage bien précis. J’ai été confronté...
Il y a 2 ans
Découvrir le cloud avec AWS en développant un data pipeline – Partie 2
Dans la première partie de ce tutoriel, nous avons présenté brièvement les principes d’un service de cloud computing comme AWS et certains de ses avantages puis avons fait nos premiers pas dans la console. Nous avons ensuite découvert l’un des services les plus emblématiques d’AWS, Amazon S3, service de stockage orienté objet, à travers la...
Il y a 2 ans
Le DataXDay revient le 24 juin prochain !
100% HYBRIDE, 100% POUR ET PAR LES DATA LOVERS Save the date : 24 juin 2021 Il sera possible d’y assister soit sur place à Paris, soit directement de chez vous via une plateforme dédiée ! L’événement s’adapte ainsi à vos envies et permet de vous offrir une expérience optimale, dans le respect des règles...
Il y a 2 ans
Découvrir le cloud avec AWS en développant un data pipeline – Partie 1
Vous souhaitez découvrir le cloud mais ne savez pas par où commencer : les concepts et façons de travailler diffèrent de ceux dont vous avez l’habitude; les sites d’AWS (Amazon Web Services), GCP (Google Cloud Platform) ou encore Microsoft Azure présentent une longue liste de produits aux noms pas toujours parlants; vous craignez que votre...
Il y a 3 ans
DataXDay devient DataXDays !
Au vu de la situation actuelle, le DataXDay comme on le connaissait, ne pouvait hélas pas avoir lieu. Nous vous proposons donc un format alternatif appelé DataXDays ! Cet événement gratuit est un ensemble de conférences en remote autour de la Data. Rencontrez nos speakers, tous les mardis de juin – à partir de 13 h...
Il y a 3 ans
XebiCon’19 – la 6ème édition est lancée !
Après le succès sans précédent de l’édition 2018, la XebiCon revient pour une 6ème édition, le 28 novembre 2019 au Palais Brongniart. Notre conférence dédiée au partage de connaissances et d’expériences est devenue un incontournable dans l’écosystème IT français. Cette édition sera le symbole de la première fondation du rapprochement entre Xebia et Publicis Sapient....
Il y a 4 ans
DevFest Paris vu par un Data Engineer
Une fois de plus, le Google Developers Group (GDG pour les intimes) nous offre un événement IT de qualité, le DevFest Paris. Se déroulant le 8 Février 2019 dans le 16ème arrondissement de Paris, cet événement accueille 600 passionnés et propose 24 talks répartis sur 4 tracks. Étant chanceux d’avoir participé à cette édition 2019...
Il y a 4 ans
Rendez-vous au Big Data Paris
Cette année encore, nous vous donnons rendez-vous au Big Data Paris ! Le lundi 11 et mardi 12 mars, nous serons au Palais des Congrès sur le stand B43, en face de nos compagnons de Zeenea. Vous y serez aussi ? Venez nous dire bonjour et partager un café ! Deux rendez-vous incontournables Mardi à...
Il y a 5 ans
Écho des TOs n°3 : Quand le mobile rencontre la data
L’Echo des TOs #3 Quand le mobile rencontre la data Les Technical Officers chez Xebia font partie, aux côtés des CTOs, d’une direction technique élargie. Ils défrichent les nouvelles tendances technologiques, creusent les méthodologies associées et orientent Xebia dans la bonne direction. Lors des 2 premiers échos, nous vous parlions de Deep Learning et...
Il y a 5 ans
Focus sur la Data sur GCP chez Early Birds avec Jonathan Norblin
Google Cloud Platform (GCP) et la Data dans le Cloud sont des axes clés pour cette année 2018 chez Xebia. Cela tombe bien, Jonathan Norblin intervient chez Early Birds, et pas sur n’importe quoi : un super combo des deux, de la data sur GCP s’il vous plaît ! Pour contextualiser, découvrez l’interview de Samuel...
Il y a 5 ans
What’s new in TensorFlow ? Des nouvelles du TensorFlow Dev Summit 2018 (1/3)
Le 30 mars dernier s’est tenu le 2e TensorFlow Dev Summit à Mountain View (Californie), avec encore une fois énormément d’annonces, de nouveaux modules et des exemples de cas d’application. En 1 an, beaucoup de choses ont changé dans l’écosystème TensorFlow, qui se positionne comme l’un des outils de Machine Learning open source les plus...
Il y a 5 ans
Automated Machine Learning: is it the end of the sexiest job of the 21st century ?
Le Harvard Business Review a défini le Data Scientist comme le poste le plus sexy du nouveau siècle. Dans l’article on peut lire : If “sexy” means having rare qualities that are much in demand, data scientists are already there. They are difficult and expensive to hire and, given the very competitive market for their services, difficult...
Il y a 5 ans
Exploration de données en Scala
Aujourd’hui, c’est la première journée où Henri va faire de la data. Henri est développeur back Scala à la base, et aimerait contribuer à la partie data de son projet. Or, la plupart des outils sont en Python. On peut certes trouver rapidement des How-To sur Internet traitant de la data en Python, mais Henri, lui,...
Il y a 5 ans
Gouvernance data lake : assistez à notre nouvelle formation
Xebia Training a le plaisir de vous annoncer la sortie de sa nouvelle formation : Comment construire une gouvernance sur un data lake ? Cette formation d’une journée propose une démarche pragmatique et itérative pour construire une gouvernance data adaptée à vos besoins et à votre entreprise. Elle est le fruit de retours d’expérience. Vous pensiez...
Il y a 5 ans
REVUE DE PRESSE XEBIA
Agilité Comment organiser une retrospective avec une grande équipe La retrospective est l’un des temps fort du sprint. Il s’agit d’un moment privilégié pour recueillir les retours d’experiences, réfléchir, s’améliorer et renforcer l’esprit d’équipe. Mais elles sont parfois difficiles à organiser sur de plus grandes équipes, ou sur plusieurs équipes simultanément, ou pour des périodes...