Résultats
Il y a 5 ans
Automated Machine Learning: is it the end of the sexiest job of the 21st century ?
Le Harvard Business Review a défini le Data Scientist comme le poste le plus sexy du nouveau siècle. Dans l’article on peut lire : If “sexy” means having rare qualities that are much in demand, data scientists are already there. They are difficult and expensive to hire and, given the very competitive market for their services, difficult...
Il y a 5 ans
Exploration de données en Scala
Aujourd’hui, c’est la première journée où Henri va faire de la data. Henri est développeur back Scala à la base, et aimerait contribuer à la partie data de son projet. Or, la plupart des outils sont en Python. On peut certes trouver rapidement des How-To sur Internet traitant de la data en Python, mais Henri, lui,...
Il y a 5 ans
Série spéciale AWS re:Invent 2017 – Réalité virtuelle & augmentée et Machine Learning
Pour ce 5e et dernier article de cette série de décembre revenant sur les annonces nous ayant marqué lors de la récente AWS re:Invent, nous revenons pour vous sur les annonces parmis les plus innovantes de cette conférence : réalité virtuelle, réalité augmentée ainsi que machine learning ! Les autres articles de cette série sont...
Il y a 5 ans
Tester du code Spark – 2 – La pratique
Que de la théorie. Les tests du code Spark semblent abonnés à cette réalité : tout reste théorique. À croire qu’en réaliser est impossible. Il est grand temps de remédier à ce problème et démontrer que le sujet est abordable par tous. Quitter la théorie, c’est débuter par les bonnes pratiques. Des réflexes sur la spécification...
Il y a 6 ans
GopherCon Denver : Retour sur la conference Go
Les 12,13,14 et 15 Juillet, a eu lieu Gophercon à Denver (Colorado, USA). La conférence la plus importante sur le langage Go. La séance du 12 a été dédiée aux ateliers. Les séances du 13 et 14 ont été dédiées aux conférences. Le 15 (Community Day), était l’occasion pour la communauté Go de s’exprimer au travers...
Il y a 6 ans
TensorFlow & Deep Learning – Episode 3 – Modifiez votre Réseau de Neurones en toute simplicité
Dans le précédent article, nous avons mis en place toute la mécanique de création et d’entraînement d’un réseau de neurones. De la gestion des inputs jusqu’à la visualisation des résultats dans TensorBoard, en passant par les opérations d’inférence et d’entraînement, toute la chaîne était présente pour entraîner notre premier réseau de neurones: le Softmax Regression....
Il y a 6 ans
Mener à bien vos ateliers d’idéation Data
À l’occasion du Mois de la Data qui sera organisé en mai par Xebia, découvrez ou redécouvrez le « Kit use cases data« . Le Mois de la Data sera articulé autour de 4 TechEvents chaque mardi du mois de mai, avec pour chacun d’eux un...
Il y a 6 ans
TensorFlow & Deep Learning – Episode 2 – Notre premier réseau de neurones
Maintenant que nous avons vu les bases de TensorFlow, nous allons pouvoir commencer à entrer dans le vif du sujet et implémenter notre premier réseau de neurones. L’objectif de cet article est de décortiquer les grandes étapes nécessaires à la création et à l’entraînement d’un réseau de neurones, jusqu’à la visualisation finale des résultats dans TensorBoard....
Il y a 6 ans
TensorFlow Dev Summit, comme si vous y étiez (2/2)
Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes APIs ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement, pas...
Il y a 6 ans
TensorFlow Dev Summit, comme si vous y étiez (1/2)
Le 15 février 2017 à Mountain View s’est tenu le tout premier TensorFlow Dev Summit. Au programme de cette conférence, la sortie de la version 1.0 de TensorFlow, mais aussi de nombreuses présentations sur les optimisations internes propres à TensorFlow, les différentes API ainsi que de nombreux cas d’usage. Si vous avez raté cet évènement,...
Il y a 6 ans
TensorFlow & Deep Learning – Épisode 1 – Introduction
Nous en entendons beaucoup parler ces derniers temps, et pour cause, TensorFlow est devenu en un temps record l’un des frameworks de référence pour le Deep Learning, utilisé aussi bien dans la recherche qu’en entreprise pour des applications en production. Au-delà de la hype présente autour de ce framework et des projets qui émergent grâce...
Il y a 6 ans
REX workshop Big Data chez AWS
Retour sur les services permettant de répondre aux cas d’utilisation big data au travers des solutions AWS. En décembre dernier, j’ai participé dans les locaux d’Amazon France à Clichy à un workshop dédié à l’utilisation des services Big Data du leader du cloud public. L’objectif de cette journée : découvrir les services permettant de répondre...
Il y a 6 ans
Tester du code Spark : 1- La théorie
Spark est plus puissant et plus simple à utiliser que MapReduce, mais comment tester du code Spark ? Voici notre vision ! Spark est un framework de calcul distribué créé à Berkeley en 2010. Il connait une adoption impressionnante. Plusieurs raisons à cela : des performances de très loin supérieures à MapReduce et un framework à...
Il y a 7 ans
PySpark sur votre IDE – Comment faire ?
Spark est maintenant un framework incontournable pour le traitement massif de données. Il est aussi de plus en plus utilisé dans les équipes de développement de projets Data, surtout via son API principale en Scala. Qu’en est-il de Python ? Si cette API est elle aussi massivement utilisée, force est de constater qu’on la retrouve...
Il y a 7 ans
Screencast : trouvez un commit avec git-bisect
En complément de l’article de Bastien Bonnet sur la commande git-bisect, voici une vidéo illustrant l’utilisation de cette commande et la recherche par dichotomie.
Il y a 7 ans
Une Introduction aux Modèles Graphiques avec Figaro
Les modèles graphiques sont un mélange de théorie des probabilités et de théorie des graphes. Ensemble, ces deux disciplines forment un framework qui permet de représenter une multitude de problèmes, tels les systèmes de diagnostics médicaux, les problèmes de reconnaissance du langage, ceux de tracking d’objets ou encore de manière plus générale les systèmes d’aide...
Il y a 7 ans
From scikit-learn to Spark ML
Dans un récent billet de blog de Databricks et Olivier Girardot, From Pandas to Apache Spark’s DataFrame, les auteurs nous montraient comment transposer le traitement et l’analyse de données faites avec la librairie Python pandas en DataFrames PySpark. L’article prouvait que, bien que quelques différences techniques existent dues au fait que les objets traités ne...
Il y a 7 ans
Découvrez SparkR, la nouvelle API de Spark
Le 11 juin dernier la version 1.4.0 de Apache Spark a été publiée. Parmi toutes les nouveautés annoncées la plus importante était la venue d’une nouvelle API venant s’ajouter aux trois déjà existantes (Scala, Java et Python) : R. R est un langage d’analyse statistique particulièrement apprécié chez les statisticiens. Nous vous présentions sur ce blog...