Par Jordi Creuse Tomàs, soutenue à Sorbonne Université le 10/12/12, co-encadrée avec Bernd Amann et Dan Vodislav Les formats RSS et Atom sont moins connus […]
Lire la suiteIndexation pour la recherche par le contenu textuel de flux RSS
Par Zeinab Hmedeh, thèse du CNAM soutenue le 13/12/2013, co-encadrée avec Michel Scholl et Cédric du Mouza Afin de réduire l’intervalle de temps nécessaire entre […]
Lire la suiteSpark + SQL + MongoDB
Spark est un Framework d’exécution distribué extrêmement puissant grâce à sa notion de RDD permettant de maximiser les ressources mémoires (RAM). Voici mes transparents de […]
Lire la suiteIndicators for Measuring Tourist Mobility
Digital traces left by active users on social networks have become a popular means of analyzing tourist behavior. The large amount of data generated by […]
Lire la suiteTemplate LaTex (PhD, HDR, Thèse, Thesis)
Template LaTeX pour HDR, à toute fin utile.
Lire la suiteBloom Filters
Le Bloom Filters est une structure de données optimisée permettant de déterminer en temps constant la présence d’une donnée à l’intérieur d’un fichier volumineux.Ce cours […]
Lire la suiteNeo4j : Travaux pratiques
Neo4j est une base de données NoSQL orientée Graph permettant de le passage à l’échelle sur de gros graphes. L’un des avantages de Neo4j est […]
Lire la suiteNeo4j slides & videos
Here are the slides and videos (on Youtube) on my course on Neo4j
Lire la suiteProjet Infrastructure de données: M2 Polytechnique
Dans le cadre du cours “Infrastructure de données” dans le M2 DataScience de Polytechnique, vous trouverez ci-joint le sujet de projet à produire et à […]
Lire la suite