Stage Data System Engineer, Paris

Innoscape est une startup RetailTech d’intelligence de marché digitale. Nous analysons les canaux de distribution et fournissons des outils d’aide à la gestion marketing et commerciale.
Notre plateforme de BigData as a Service fournit à nos clients, grandes marques B2C, la visibilité opérationnelle d’un seul clic afin de contrôler la présence de leurs produits, optimiser les actions de leurs forces de vente, traquer le référencement des produits concurrents et leurs prix de vente, analyser les avis consommateurs… pour gagner des parts de marché.

Description du poste :

  • Dans sa recherche constante de maintenir une plateforme d’exploitation de la donnée en adéquation avec l’évolution rapide de l’écosystème Big Data, Innoscape propose un stage en Data System / Engineering pour le développement d’une nouvelle version de sa plateforme.
  • Intégré dans l’équipe, vos travaux d’innovation et de recherche en data engineering / architecture permettront de faire évoluer la plateforme de Innoscape, d’assurer la fluidité, sécurité, performance des pipelines de traitement de la donnée depuis la collecte jusqu’à la restitution au client final.

Mission :

  • Participer à la mise en place d’une nouvelle architecture / infrastructure Big Data de notre plateforme.
  • Participer à l’amélioration de notre Stack actuel afin de relever les challenges de Fluidité, Performances, Scalabilité, Stockage dans la valorisation de nos données : phase de recherche sur des environnements de calculs distribués, développement d’outils, mise en production, et tests, data lineage.
  • Tester à travers des POCs différentes architectures (Collecte / Transformation/ Analyse / Sécurité/ Restitution) impliquant les composants Big Data (Elasticseach, Apache Lucene, Apache Solr, NoSQL, SQL, Hadoop, Spark, Nifi, Hive, Machine Learning etc…).
  • Optimiser et Développer des scripts de transformation en sparkSQL / Scala.
  • Participer à l’amélioration et/ou à la création des étapes du workflow.
  • Vérifier et assurer la compatibilité des outils de collecte et des pipelines existants avec la nouvelle architecture système.
  • Réaliser un audit comparatif entre le nouveau système et le système en production.
  • Participer au Déploiement et à la Documentation de la nouvelle architecture

Compétences :

  • Maîtriser un ou plusieurs langages structurés (Javascript, Java, C/C++, Scala…) et des systèmes SQL / NoSQL.
  • Avoir des connaissances solides en architecture réseau et en administration de systèmes (Linux/Ubuntu/Apache/Nginx) ainsi qu’en outils cloud (AWS, Azure, Google Cloud).
  • Avoir une appétence pour les technologies utilisées dans le Big Data (Hadoop, Map Reduce, Spark, Nifi, Elasticsearch ou Apache Solr…).
  • Avoir une expérience de méthodologies d’ingénierie informatique: contrôle des sources, tests unitaires, revue de code.
  • Être curieux et avoir une forte capacité d’adaptation dans un environnement en constante mutation.
  • Travailler et partager les connaissances et compétences acquises avec les membres de l’équipe.
  • Démontrer la capacité à collaborer avec des personnes d’autres disciplines.

Profil :

  • Bac +5
  • Ecole d’ingénieur ou grande école d’informatique ou Big Data, PhD (CIFRE) ou Master Recherche
  • Anglais courant
  • Esprit d’équipe et d’initiative

 

Apply