Autrefois appelée Analyse de données, puis Data Mining, son nouveau nom à la mode est la Data Science ou le Machine Learning.
Ces appellations désignent la même chose, à savoir un ensemble de techniques et d’outils ayant pour but d’extraire de la connaissance d’un ensemble de données.
Réservée longtemps à des domaines métier précis (e.g. Actuariat), et confrontée à des contraintes techniques (volumes de données, temps de traitements), elle s’est démocratisée.
En effet, l’évolution des technologies autour de la Data rend son utilisation accessible au grand public :
- Big Data : permettant de manipuler des masses très importantes de données
- Base de données In-Memory : les calculs et traitements passent de plusieurs heures à quelques minutes
- Intelligence Artificielle : la recherche dans ce domaine a progressé et de nouveaux algorithmes prédictifs sont accessibles.
La Data Science est désormais accessible à toute organisation faisant de la BI. La majorité des éditeurs proposent leurs solutions, cependant il est difficile d’apprécier ce que cette technologie peut apporter pour le traitement des données d’une entreprise.
Elever le niveau de maturité de son système décisionnel
Les solutions de Business Intelligence ont globalement atteint un certain niveau de maturité dans les entreprises. Celles ayant investi dans des systèmes décisionnels possèdent des solutions centralisant l’information de l’entreprise avec un DataWarehouse et une plateforme de reporting ou de Data Viz.
L’information, harmonisée et historisée peut être largement consultée et permet de répondre aux questions :
- Que s’est-il passé ? Avec des rapports et tableaux de bord décrivant factuellement l’activité de l’entreprise
- Pourquoi / Comment cela s’est-il passé ? Grâce à des outils d’analyse Adhoc pour explorer les informations de l’entreprise
Une fois cela en place on peut se poser les questions :
- Que va-t-il se passer ?
- Que faut-il faire ?
On peut y répondre grâce à la masse d’informations stockées dans les Datawarehouse et dans les bases Big Data, mais celle-ci sont difficilement exploitables par un Analyste. Cela demande du temps et une connaissance globale de l’information de l’entreprise.
Tout l’enjeu de la Data Science est donc d’accélérer ce processus, et de le rendre accessible à n’importe quel collaborateur de l’entreprise.
Les solutions de Data Science aide l’analyse par diverse approches et niveau de sophistication :
Création d’un Modèle Prédictif ou de Machine Learning
Ce cas d’utilisation est le plus utilisé. Le but est de prédire la valeur d’un indicateur ou l’occurrence d’un évènement. Pour cela, on prépare un jeu de données qui décrit le mieux possible ce que l’on souhaite prédire. Lorsqu’on a suffisamment d’historique et de champs décrivant la réalité, on peut appliquer des fonctions statistiques pour générer un modèle prédictif. Ce modèle est par la suite appliqué à de nouvelles données afin de réaliser des prédictions.
Par exemple, un modèle très utilisé est la Classification. Il permet d’établir des corrélations entre les champs d’un jeu de donnée et un indicateur. On obtient alors la liste des champs influençant le plus un indicateur. En appliquant ce modèle à de nouvelles données, il va prédire la valeur de l’indicateur en fonction des autres champs.
Ce type d’analyse est désormais automatisé grâce aux outils de Data Science actuels. Un utilisateur connaissant les concepts Data Science peut générer et appliquer des modèles en quelques clics. SAP propose des produits pour cette utilisation avec SAP Predictive Analytics et SAP Analytics Cloud.
Ces modèles peuvent être incorporés dans un Data Warehouse pour automatiser les prédictions. SAP propose également des librairies de fonctions prédictives avec sa plateforme HANA.
BI et Data Science Embarquée
SAP Analytics Cloud propose des analyses prédictives intégrées dans des rapports et tableaux de bord. Il est possible alors d’appliquer des formules Predictive à la volée pour obtenir des informations à partir des données du rapport.
Par exemple on peut voir quels champs contribuent à un indicateur. On peut aussi exécuter des scénarios « What if », pour voir quels paramètres modifier pour améliorer un indicateur.
Former des « Data Science Citizens »
Grâce aux nouveaux produits Data Science simplifiant son utilisation dans les entreprises, il y aura de plus en plus de consommateurs potentiels d’informations prédictives. Ce profil d’utilisateur, sensibilisé aux problématiques Data Science devront être capables de produire un modèle prédictif et d’en tirer les bonnes analyses. Ces Data Science Citizen pourront travailler avec les Data Scientists, experts du sujet, sur des projets plus complexes nécessitant des modèles mieux adaptés à leurs besoins que ceux produits de manière automatique.
Ils pourront lancer des sujets prédictifs au sein de leurs équipes et services, et faire appel aux experts pour industrialiser ou améliorer leurs modèles.
SAP propose cette synergie avec SAP Predictive Analytics et Sap Analytics Cloud.
Les Data Science Citizen peuvent réaliser leurs prédictions assistées par l’outil, tandis que les Data Scientists peuvent développer leurs propres modèles.
Un axe d’innovation pour votre système BI
En conclusion, adopter une solution Data Science ouvre des opportunités pour tirer profit de l’information stockée d’une organisation.
Les outils et concept Data Science sont maintenant accessibles pour les analystes « profanes » en la matière. Chaque équipe peut se lancer dans une analyse pour extraire des informations de leur masse de données.
C’est aussi une démarche allant dans la continuité d’investissements réalisés pour un Data Warehouse moderne (e.g. SAP HANA) ou une base Big Data. Les processus d’analyse Data Science tirent directement profit de ces technologies.
Philippe Dobrowlanski
Derniers articles parPhilippe Dobrowlanski (voir tous)
- Nouvelle version SAP BI Platform 4.3 – Web intelligence, Cloud – Sommes-nous prêts ? - 30 mars 2020
- Que faire avec la Data Science aujourd’hui ? - 19 septembre 2018
- Moderniser son système décisionnel avec SAP - 17 mai 2017