Spark est actuellement le projet open source le plus actif sous la plate-forme Apache Software Foundation (ASF). Il est aussi l'un des projets open source de big data le plus actif

Spark permet aux développeurs de créer un traitement de données complexe en plusieurs étapes routines, fournissant une API de haut niveau et un cadre tolérant aux pannes qui permet aux programmeurs à se concentrer sur la logique plutôt que sur les problèmes d'infrastructure ou d'environnement comme une défaillance matérielle par exemple

Dans cette formation vous allez vous familiariser avec les principes fondamentaux de Spark en utilisant le langage Scala.  Spark est écrit en Scala. Il fonctionne en Java virtuel machines (JVM)

Vous allez maitriser l’utilisation MapReduce avec Spark qui est une alternative à l'utilisation traditionnelle MapReduce sur Hadoop

L’utilisation de MapReduce avec Hadoop a été jugé inadaptée aux requêtes interactives ou temps réel, avec une faible latence applications

Un inconvénient majeur de l'implémentation MapReduce de Hadoop était sa persistance des données intermédiaires sur le disque entre le Map et le Reduce en phases de traitement

Dans cette formation vous allez apprendre à implémenter une structure distribuée, tolérante aux pannes et in-memory appelée Resilient Distributed Dataset (RDD)

Vous allez également apprendre à traiter les données non structurées

Dans le chapitre de Spark SQL les notions des DataFrame et DataSet ne seront plus un secret pour vous

Vous avez surement entendu parler du traitement des données qui arrivent en temps réel, ce qu’on appelle le Streaming

Un chapitre bien détaillé vous attend afin que vous puissiez monter en compétence rapidement avec Spark Streaming

Cette formation Microsoft Power BI, vous permettra de comprendre et utiliser Microsoft Power BI, un des outils de reporting les plus innovants du marché

On vous a créé cette formation pour ouvrir la Business Intelligence au plus grand nombre

Une méthode en 7 actions est développée pour vous permettre de suivre pas à pas la création de solutions de reporting grâce à Power BI

En appliquant cette méthode, vous serez capables de créer vos propres reportings, ce qui améliorera significativement votre quotidien et celui de vos collègues !

A l’issue de cette formation, vous serez capable :

  • Orientée document, MongoDB est une base de données NoSQL et propose un modèle de requêtage riche, de grosses performances, une très bonne scalabilité et plein d'autres fonctionnalités avancées.
  • Cette formation MongoDB, administration vous permettra de comprendre les cas d'usage de MongoDB, de s'approprier ce modèle de données en apprenant à vivre sans transactions et sans contraintes relationnelles.
  • Cette formation MongoDB, administration est destinée aux développeurs désirant concevoir et créer des applications utilisant MongoDB. Elle couvre la modélisation orientée document, les requêtes de sélection/insertion/mise à jour/suppression, une introduction au MapReduce et les bases de l'administration.
  • Pendant cette formation MongoDB, administration, vous apprendrez à concevoir un schéma de données orienté document, à manipuler vos données, à optimiser vos performances et à tirer parti des fonctionnalités d'agrégation.
  • Durant cette formation MongoDB, administration, vous appréhenderez le fonctionnement du moteur MongoDB, à administrer MongoDB au quotidien et à mettre en œuvre une solution de haute disponibilité avec le système de Replica Set.
  • Vous apprendrez également avec cette formation MongoDB, administration à mettre en œuvre une solution performante pour la montée en charge avec la fonctionnalité avancée du Sharding.
  • Cette formation MongoDB, administration vous permettra également d'optimiser vos bases de données MongoDB par la mise en place d'une indexation optimale. 

A l’issue de cette formation, vous serez capable :
- Vous avez suivi la formation sur la découverte des bases de données NoSQL et vous souhaitez aller plus loin ? Découvrez sans plus attendre comment les moteurs NoSQL distribués libres vous permettent de gérer de grandes quantités de données sur des serveurs peu chers. Vous explorerez ainsi des moteurs NoSQL comme Couchbase Server ou Apache Cassandra.