Projet Datalake Analytics

Analyse de données prédictives pour un grand groupe international de l’hôtellerie. 

Objectifs :

  • Créer et configurer le container permettant l’analyse de donnée prédictive pour optimiser le taux de remplissage de ses hôtels et améliorer le parcours client.
  • Désiloter l’ensemble des données internes afin de fournir une source de référence groupe.
  • Devenir un support à la prise de décision.

Environnement :

  • Technique : R, Hue, Dataiku DSS, TALEND, Spark, Hadoop Cloudera, Scala, Shell, Hive, Impala
  • Fonctionnel : Outil de Predictive Analytics – Exploitation de données, Visual Insight Microstrategy, Cognos

Challenges :

  • Développement du chargement « générique »
  • Intégration des données open data

Prestations :

  • Développement d’un mécanisme de chargement « générique » pour l’intégration de données, l’optimisation du format et de la structure ainsi que l’archivage des données brutes
  • Extraction & Intégration des données
  • Développement d’un mécanisme d’intégration et validation de la pertinence de données Open Data
  • Aide à l’analyse des données en étroite relation avec l’équipe data science interne à l’entreprise