Big Data Developer H/F
POST Luxembourg
Itzig, LU
il y a 2j
source : Monster

Acteur majeur des télécoms et opérateur national du service postal et financier postal, le groupe POST Luxembourg est un pilier incontournable de l'économie luxembourgeoise.

Afin de renforcer ses équipes au sein de la Direction Générale, le département Digital Transformation qui regroupe les métiers dédiés à la réalisation de prototypes, d'analyses et de l'intégration des interfaces numériques, recherche actuellement un(e) : Description du poste :

Vos missions

  • Développer des programmes et scripts en interaction avec la plateforme POST Data Intelligence (écosystème Hadoop) et les documenter
  • Déployer ces programmes dans un environnement Rancher via une chaine d’intégration continue en étant garant des bonnes pratiques en la matière, et participer à leur maintenance
  • Alimenter et faire évoluer le Data Lake (plateforme POST Data Intelligence, source d’analyse des Data Scientists) en implémentant des solutions ETL afin d’intégrer et de combiner des sources de données multiples et hétérogènes, en batch et en temps réel
  • Travailler en étroite collaboration avec l’équipe de Data Scientists afin de déterminer les données pertinentes nécessaires (déjà existantes dans la plateforme Big Data ou à intégrer)
  • Rechercher constamment de nouvelles sources de données internes et externes à intégrer dans la plateforme Big Data
  • Être un acteur majeur de la gouvernance de données POST, en implémentant des règles de gestion de la qualité des données, des règles de rétention, d’archivage et d’anonymisation et enfin en participant à l’alimentation du dictionnaire de données (metadata)
  • Établir et retranscrire les besoins du management (gouvernance de données), des Data Scientists, des Data Architects et des Juristes.
  • Participer au cycle d’astreinte afin de pouvoir assurer un support 24 / 7
  • Votre profil

  • Être titulaire d’un Master en Sciences Informatiques / Sécurité de l’Information et / ou Statistiques / Mathématiques et bénéficier d’une expérience de 5 à 7 années à une fonction similaire
  • Avoir une très bonne connaissance et expérience des techniques de statistiques avancées et de Data Mining (régression, text mining, social network analysis, etc)
  • Être force de proposition en termes d’architecture de données
  • Maitriser les techniques de Machine Learning (clustering, random forest, boosting, réseaux de neurones artificiels, etc.)
  • Disposer d’une très bonne connaissance et maitrise des technologies / outils suivants :
  • Python (spécifiquement les librairies pandas, scikit-learn et numpy)
  • NoSQL technologies ( MongoDB, HBase)
  • SQL-based technologies ( MySQL, Oracle, DB2, SQL Server )
  • Analytics en temps réel : Apache Kafka et Storm, Spark
  • Hadoop (HDFS, Hive, Spark, Zeppelin Notebook, Ambari) et la suite Hortonworks Data Platform ou Cloudera
  • Une connaissance d’un outil ETL comme Talend ou Trifacta constitue un avantage
  • Être autonome, flexible et orienté (e) clients et solutions
  • Être reconnu (e) pour votre esprit critique, d’analyse et de synthèse
  • Avoir d’excellentes aptitudes rédactionnelles et de communication en français et en anglais
  • Signaler cette offre d'emploi
    checkmark

    Thank you for reporting this job!

    Your feedback will help us improve the quality of our services.

    Postuler
    Mon email
    En cliquant sur « Continuer », je consens au traitement de mes données et à recevoir des alertes email, tel que détaillé dans la Politique de confidentialité de neuvoo. Je peux retirer mon consentement ou me désinscrire à tout moment.
    Continuer
    Formulaire de candidature