I teach this course at ESILV (5th year), M2 DataScience at Polytechnic and MS SIO at CentraleSupelec. You will find above the slides and exercices […]
Lire la suiteCatégorie : Enseignement
TP – Elasticsearch
Le logiciel elasticsearch est très facile d’installation et de déploiement dans un environnement distribué.Son but est d’intégrer du contenu semi-structuré (JSon) orienté texte et de […]
Lire la suiteSpark + SQL + MongoDB
Spark est un Framework d’exécution distribué extrêmement puissant grâce à sa notion de RDD permettant de maximiser les ressources mémoires (RAM). Voici mes transparents de […]
Lire la suiteBloom Filters
Le Bloom Filters est une structure de données optimisée permettant de déterminer en temps constant la présence d’une donnée à l’intérieur d’un fichier volumineux.Ce cours […]
Lire la suiteNeo4j : Travaux pratiques
Neo4j est une base de données NoSQL orientée Graph permettant de le passage à l’échelle sur de gros graphes. L’un des avantages de Neo4j est […]
Lire la suiteNeo4j slides & videos
Here are the slides and videos (on Youtube) on my course on Neo4j
Lire la suiteProjet Infrastructure de données: M2 Polytechnique
Dans le cadre du cours “Infrastructure de données” dans le M2 DataScience de Polytechnique, vous trouverez ci-joint le sujet de projet à produire et à […]
Lire la suiteElasticsearch – Slides & Videos
Here is a course on Elasticsearch, what is it, what for, where does it come from, etc. We will see how to query this NoSQL […]
Lire la suiteDénormalisation pour le NoSQL : exercices
Lorsque l’on souhaite transformer sa base de données relationnelles pour la stocker dans une base NoSQL, il est nécessaire de définir un modèle de stockage […]
Lire la suite