Informatique décisionnelle
Un article de Wikipédia, l'encyclopédie libre.
L’informatique décisionnelle (en anglais : DSS pour Decision Support System ou encore BI pour Business Intelligence) désigne les moyens, les outils et les méthodes qui permettent de collecter, consolider, modéliser et restituer les données d'une entreprise en vue d'offrir une aide à la décision et de permettre aux responsables de la stratégie d'une entreprise d’avoir une vue d’ensemble de l’activité traitée.
Ce type d’application utilise en règle générale un datawarehouse (ou entrepôt de données) pour stocker des données transverses provenant de plusieurs sources hétérogènes et fait appel à des traitements lourds de type batch pour la collecte de ces informations.
L’informatique décisionnelle s’insère dans l’architecture plus large d’un système d'information.
Les applications classiques « d’entreprise » permettent de stocker, restituer, modifier les données des différents services opérationnels de l’entreprise (production, marketing, facturation comptabilité, etc.). Ces différents services possèdent chacun une ou plusieurs applications propres, et les données y sont rarement structurées ou codifiées de la même manière que dans les autres services. Chaque service dispose le plus souvent de ses propres tableaux de bord et il est rare que les indicateurs (par exemple : le chiffre d'affaires sur un segment de clientèle donné) soient mesurés partout de la même manière, selon les mêmes règles et sur le même périmètre.
Pour pouvoir obtenir une vision synthétique de chaque service ou de l’ensemble de l’entreprise, il convient donc que ces données soient filtrées, croisées et reclassées dans un entrepôt de données central. Cet entrepôt de données va permettre aux responsables de l’entreprise et aux analystes de prendre connaissance des données à un niveau global et ainsi prendre des décisions plus pertinentes, d’où le nom d’informatique décisionnelle.
Sommaire |
[modifier] L'informatique décisionnelle
Les données applicatives métier sont stockées dans une (ou plusieurs) base(s) de données relationnelle(s) ou non relationnelles.
Ces données sont extraites, transformées et chargées dans un entrepôt de données généralement par un outil de type ETL (Extract-Tranform-Load) ou en français ETC (Extraction-Tranformation-Chargement)
Un entrepôt de données peut prendre la forme d’un datawarehouse ou d’un datamart. En règle générale, le datawarehouse globalise toutes les données applicatives de l’entreprise, tandis que les datamarts (généralement alimentés depuis les données du datawarehouse) sont des sous-ensembles d’informations concernant un métier particulier de l’entreprise (marketing, risque, contrôle de gestion, ...). Le terme comptoir de données ou magasin de données est aussi utilisé pour désigner un datamart.
Le reporting est vraisemblablement l'application la plus utilisée encore aujourd'hui de l’informatique décisionnelle, il permet aux gestionnaires :
- de sélectionner des données relatives à telle période, telle production, tel secteur de clientèle, etc.,
- de trier, regrouper ou répartir ces données selon les critères de leur choix,
- de réaliser divers calculs (totaux, moyennes, écarts, comparatif d'une période à l'autre, ...),
- de présenter les résultats d’une manière synthétique ou détaillée, le plus souvent graphique selon leurs besoins ou les attentes des dirigeants de l’entreprise.
Les programmes utilisés pour le reporting permettent bien sûr de reproduire de période en période les mêmes sélections et les mêmes traitements et de faire varier certains critères pour affiner l’analyse. Mais le reporting n'est pas à proprement parler une application d'aide à la décision. L'avenir appartient plutôt aux instruments de type tableau de bord équipés de fonctions d'analyses multidimensionnelles de type Olap.
Les datamart et/ou les datawarehouses peuvent aussi alimenter des bases de données multidimensionnelles, qui permettent l’analyse très approfondie de l’activité de l’entreprise, grâce à des statistiques recoupant des informations relatives à des activités apparemment très différentes ou très éloignées les unes des autres, mais dont l’étude fait souvent apparaître des dysfonctionnements, des corrélations ou des possibilités d’améliorations très sensibles.
L'interopérabilité entre les systèmes d'entrepôt de données, les applications informatiques ou de gestion de contenu, et les systèmes de reporting est réalisée grâce à une gestion des métadonnées.
[modifier] Du tableau à l'hypercube
L'informatique décisionnelle s'attache à mesurer :
- un certain nombre d' indicateurs ou de mesures (que l'on appelle aussi les faits ou les métriques),
- restitués selon les axes d'analyse (que l'on appelle aussi les dimensions).
[modifier] Le tableau
Par exemple, on peut vouloir mesurer :
- 3 indicateurs : le chiffre d'affaires, le nombre de ventes, le montant de taxes pour les ventes de produits,
- selon un premier axe, l'axe temps : par année, par trimestre, par mois,
- et selon un second axe, l'axe produits : famille de produits, gamme de produits, référence produit.
On obtient ainsi un tableau à deux entrées :
- par exemple en lignes : la nomenclature produits à 3 niveaux (famille, gamme, référence),
- et en colonnes : les années, décomposées en trimestres, décomposés en mois,
- avec au croisement des lignes et colonnes, pour chaque cellule : le chiffre d'affaires, le montant de taxes et le nombre de ventes.
A titre d'illustration, les tableaux croisés d'Excel permettent de constuire ce type de tableau de bord depuis une base de données.
[modifier] Le cube
Si l'on s'intéresse à un troisième axe d'analyse :
- par exemple, la répartition géographique : par pays, par régions, par magasins,
on obtient une dimension de plus et on passe ainsi au cube.
Les tableaux croisés d'Excel permettent de représenter ce type de cube avec le champ "page".
[modifier] L'hypercube
Si l'on s'intéresse à un axe d'analyse supplémentaire :
- par exemple, la segmentation des clients : par catégorie, par profession,
on obtient alors un cube à plus de 3 dimensions, appelé hypercube.
Le terme cube est souvent utilisé en lieu et place d' hypercube.
Les outils du monde décisionnel permettent de modéliser ces cubes ou hypercubes : outils OLAP, M-OLAP, R-OLAP, H-OLAP, etc .
[modifier] La navigation dans un hypercube
Les outils du monde décisionnel offrent des possibilités de « navigation » dans les différentes dimensions du cube ou de l'hypercube :
- le drill down ou le forage avant : c'est la possibilité de « zoomer » sur une dimension (par exemple d'éclater les années en 4 trimestres pour avoir une vision plus fine, ou de passer du pays aux différentes régions),
- le drill up ou le forage arrière : c'est l'opération inverse qui permet d'« agréger » les composantes de l'un des axes (par exemple de regrouper les mois en trimestre, ou de totaliser les différentes régions pour avoir le total par pays),
- le slice and dice (que l'on peut traduire par « hacher menu », c'est-à-dire couper en lamelles puis en dés) : c'est une opération plus complexe qui entraine une permutation des axes d'analyse (par exemple, on peut vouloir remplacer une vue par pays/régions par une nouvelle vue par familles et gammes de produits)
- le drill through : lorsqu'on ne dipose que de données agrégées (indicateurs totalisés), le drill through permet d'accéder au détail élémentaire des informations (chaque vente de chaque produit à chaque client dans chaque magasin).
[modifier] Fonctions essentielles
Un système d'information décisionnel (SID) assure quatre fonctions fondamentales, à savoir la collecte, l'intégration, la diffusion et la présentation des données. À ces quatre fonctions s'ajoute une fonction de contrôle du SID lui-même, l'administration.
[modifier] Collecte
La collecte (parfois appelée datapumping) est l'ensemble des tâches consistant à détecter, à sélectionner, à extraire et à filtrer les données brutes issues des environnements pertinents compte tenu du périmètre du SID. Les sources de données internes et/ou externes étant souvent hétérogènes tant sur le plan technique que sur le plan sémantique, cette fonction est la plus délicate à mettre en place dans un système décisionnel complexe. Elle s'appuie notamment sur des outils d'ETL (extract-transform-load pour extraction-transformation-chargement).
Cette alimentation utilise les données sources issues des systèmes transactionnels de production, le plus souvent sous forme de :
- compte-rendu d'événement ou compte-rendu d'opération : c'est le constat au fil du temps des opérations (achats, ventes, écritures comptables, ...), le film de l'activité de l'entreprise
- compte-rendu d'inventaire ou compte-rendu de stock : c'est l'image photo prise à un instant donné (à une fin de période : mois, trimestre, ...) de l'ensemble du stock (les clients, les contrats, les commandes, les encours, ...).
La fonction de collecte joue également, au besoin, un rôle de recodage. Une donnée représentée différemment d'une source à une autre impose le choix d'une représentation unique pour les futures analyses.
[modifier] Intégration
L'intégration consiste à concentrer les données collectées dans un espace unifié, dont le socle informatique essentiel est l'entrepôt de données. Élément central du dispositif, il permet aux applications décisionnelles de bénéficier d'une source d'information commune, homogène, normalisée et fiable, susceptible de masquer la diversité de l'origine des données.
Au passage les données sont épurées ou transformées par :
- un filtrage et une validation des données en vue du maintien de la cohérence d'ensemble (les valeurs acceptées par les filtres de la fonction de collecte mais susceptibles d'introduire des incohérences de référentiel par rapport aux autres données doivent être soit rejetées, soit intégrées avec un statut spécial)
- une synchronisation (s'il y a nécessité d'intégrer en même temps ou à la même « date de valeur » des événements reçus ou constatés de manière décalée ou déphasée)
- une certification (pour rapprocher les données de l'entrepôt des autres systèmes « légaux » de l'entreprise comme la comptabilité ou les déclarations réglementaires).
C'est également dans cette fonction que sont effectués éventuellement les calculs et les agrégations (cumuls) communs à l'ensemble du projet.
La fonction d'intégration est généralement assurée par la gestion de métadonnées, qui assurent l'interopérabilité entre toutes les ressources informatiques, que ce soit des données structurées (bases de données accédées par des progiciels ou applications), ou des données non structurées (documents et autres ressources non structurées, manipulés par les systèmes de gestion de contenu).
[modifier] Diffusion (ou distribution)
La diffusion met les données à la disposition des utilisateurs, selon des schémas correspondant au profil ou au métier de chacun, sachant que l'accès direct à l'entrepôt de données ne correspondrait généralement pas aux besoins d'un décideur ou d'un analyste. L'objectif prioritaire est de segmenter les données en contextes informationnels fortement cohérents, simples à utiliser et correspondant à une activité décisionnelle particulière. Alors qu'un entrepôt de données peut héberger des centaines ou des milliers de variables ou indicateurs, un contexte de diffusion raisonnable n'en présente que quelques dizaines au maximum. Chaque contexte peut correspondre à un datamart, bien qu'il n'y ait pas de règles générales concernant le stockage physique. Très souvent, un contexte de diffusion est multidimensionnel, c'est-à-dire modélisable sous la forme d'un hypercube; il peut alors être mis à disposition à l'aide d'un outil OLAP.
Les différents contextes d'un même système décisionnel n'ont pas tous besoin du même niveau de détail. De nombreux agrégats ou cumuls, n'intéressant que certaines applications et n'ayant donc pas lieu d'être gérés en tant qu'agrégats communs par la fonction d'intégration, relèvent donc de la diffusion. Ces agrégats peuvent être, au choix, stockés de manière persistante ou calculés dynamiquement à la demande.
[modifier] Présentation
Cette quatrième fonction, la plus visible pour l'utilisateur, régit les conditions d'accès de l'utilisateur aux informations. Elle assure le fonctionnement du poste de travail, le contrôle d'accès, la prise en charge des requêtes, la visualisation des résultats sous une forme ou une autre. Elle utilise toutes les techniques de communication possibles (outils bureautiques, requêteurs et générateurs d'états spécialisés, infrastructure web, télécommunications mobiles, etc).
[modifier] Administration
C'est la fonction transversale qui supervise la bonne exécution de toutes les autres. Elle pilote le processus de mise à jour des données, la documentation sur les données (les méta-données), la sécurité, les sauvegardes, la gestion des incidents.
[modifier] Le projet décisionnel
à compléter
Procéder d'abord à un business plan collecter les informations tels que :les dépenses et les recettes il faut avoir un maximum d'informations profit pour la conduite de projet (lien direct avec la comptabilité de l'entreprise) le chargé d'affaire gére un bon de commande client, il doit donc gérer une commande de A à Z avec les achats de matieres premieres et marchandises nécéssaires et ensuite il vend ses marchandises tranformées par l'entreprise Le but est que s'il achète pour 100 euros de matieres 1eres non tranformées, une fois le tout assemblé transformé en produit final (vendable) il doit vendre au moins à supèrieur au cout d'achat pour conuvrir le cout des matieres et des salaires directement imputable à la commande et essayer aussi de faire de marge, c'est à direqu'une fois toutes les charges payées on regarde combien il reste et cette propension marginale s'appelle la marge d'expoloitation brut
[modifier] L'Open Source dans le monde du décisionnel
[1]: Pentaho
Cette solution OpenSource propose un ensemble d'outils développés en environnement Java, qui couvrent les fonctions de reporting, d'analyse, de data mining, gestion des processus...
[2]: OPENI
Il s'agit d'un outil de reporting analytique qui se base sur un moteur OLAP [MONDRIAN].
[3] Talend Open Studio
Il s'agit d'une solution OpenSource d'ETL dédiée à la manipulation de données.
[4]: SpagoBI
Il s'agit d'une plateforme BI dotée de nombreux outils d'analyse (dashboard,...)
[modifier] Voir également
[modifier] Liens internes
- Exploration de données ou Data mining
- Entrepôt de données ou Datawarehouse
- Magasin de données ou Datamart
- Métadonnée
- Hypercube OLAP, M-OLAP, R-OLAP, H-OLAP
- Liste d'outils décisionnels
- Modèle de données dit "en étoile" ou "en flocon"
- Système d'information de gestion
- Recherche opérationnelle
[modifier] Liens externes
- (fr) Bulletins de la société française de recherche opérationnelle et d'aide à la décision (Roadef),
- (fr) histoire de la recherche opérationnelle.
- (fr) Un site consacré au projet Business Intelligence.
- (fr) Un essai de définition critique de la Business Intelligence
- Strategic Decision Support using Computerised Morphological Analysis From the Swedish Morphological Society
Portail de l'informatique – Accédez aux articles de Wikipédia concernant l’informatique. |