L'auteur
Description de l'auteur
Articles
Il y a 6 ans
Data Science & Internet of Things
Avec le développement de la connectivité sur de nombreux objets et appareils, l’apparition des nouveaux protocoles de communication comme LorA et Sigfox, l’arrivée sur le marché des capteurs peu chers et l’inflation des données qu’ils émettent, l’IoT (Internet des Objets) prend désormais de la place, non seulement dans nos vies quotidienne, mais aussi au niveau...
Il y a 7 ans
Retours sur PyData Paris
Les 14 et 15 juin, nous étions à la deuxième édition parisienne de PyData, la conférence internationale regroupant tous les sujets traitant de près ou de loin de Python et de la Data. Au cours de cet article, nous allons vous faire un retour sur quelques-unes des interventions qui nous ont marqués. Overview : programme...
Il y a 7 ans
PySpark sur votre IDE – Comment faire ?
Spark est maintenant un framework incontournable pour le traitement massif de données. Il est aussi de plus en plus utilisé dans les équipes de développement de projets Data, surtout via son API principale en Scala. Qu’en est-il de Python ? Si cette API est elle aussi massivement utilisée, force est de constater qu’on la retrouve...
Il y a 7 ans
Introduction des bases de la programmation en Python
L’une de nos valeurs est le partage de connaissance. Dans cette logique, nous avons pris l’habitude de contribuer dans le magazine Programmez! sur différents sujets. Cette fois-ci, c’est un de nos Data Scientists, Yoann Benoit, qui a souhaité écrire un article sur Python. C’est un langage de programmation interprété et orienté objet de plus en...
Il y a 7 ans
From scikit-learn to Spark ML
Dans un récent billet de blog de Databricks et Olivier Girardot, From Pandas to Apache Spark’s DataFrame, les auteurs nous montraient comment transposer le traitement et l’analyse de données faites avec la librairie Python pandas en DataFrames PySpark. L’article prouvait que, bien que quelques différences techniques existent dues au fait que les objets traités ne...
Il y a 8 ans
Article Programmez! – Vos premiers pas en Machine Learning
En avril 2015, le Magazine Programmez a publié un article sur le Machine Learning. Ecrit par deux Xebians, Yoann Benoit et Thomas Ounnas, cet article vous forme au Machine Learning. En effet, au travers de cet article, ils vous proposent une initiative au Machine Learning, qui est un sous-ensemble de l’Intelligence Artificielle. Cette discipline permet...
Il y a 8 ans
Les outils de la Data Science : Spark MLlib, mise en pratique (2/2)
Dans le précédent article, nous vous présentions les différents concepts liés à MLlib : les types de RDD à fournir, la structure des algorithmes et la démarche à adopter pour construire une chaîne de traitement de Machine Learning. Nous allons maintenant mettre en pratique ces concepts à travers plusieurs exemples basés sur les différents algorithmes...
Il y a 8 ans
Tech-Event Initiation au Machine Learning avec Spark le 4 Juin
Savoir faire du Machine Learning, notamment dans un contexte Big Data, est une compétence de plus en plus recherchée de nos jours. Pourtant cette discipline est loin d’être la plus simple à acquérir. Xebia vous propose de vous initier progressivement au Machine Learning et au framework Spark. Nous utiliserons les outils les plus récents des...
Il y a 8 ans
Les outils de la Data Science : Spark MLlib, théorie et concepts (1/2)
Dans deux précédents articles nous vous présentions R et Python et comment ils sont utilisés en Data Science. La limite de ces langages est cependant rapidement atteinte lorsque l’on a affaire à de gros jeux de données qui ne tiennent plus en mémoire. Dans ce cas là, la solution à envisager est de distribuer les...
Il y a 8 ans
Les outils de la Data Science : Python Data Tools
Suite de notre série d’articles de présentation des outils de la Data Science, nous présentons aujourd’hui Python. Python est un langage orienté objet bénéficiant d’une syntaxe précise et efficace. Il est couramment utilisé par les Data Scientists grâce à ses librairies d’analyse numérique et de calcul scientifique (numpy, scipy, pandas) et de visualisation (matplotlib), mais...
Nous recrutons
Être un Sapient, c'est faire partie d'un groupe de passionnés ; C'est l'opportunité de travailler et de partager avec des pairs parmi les plus talentueux.