qu’est-Ce que l’Entreposage de Données?
Un Data Warehousing (DW) est un processus de collecte et de gestion de données provenant de sources variées afin de fournir des informations commerciales significatives. Un entrepôt de données est généralement utilisé pour connecter et analyser des données commerciales provenant de sources hétérogènes. L’entrepôt de données est le cœur du système de BI, conçu pour l’analyse et le reporting des données.
C’est un mélange de technologies et de composants qui facilite l’utilisation stratégique des données., C’est le stockage électronique d’une grande quantité d’informations par une entreprise qui est conçu pour la requête et l’analyse au lieu du traitement des transactions. C’est un processus de transformation des données en informations et de mise à la disposition des utilisateurs en temps opportun pour faire une différence.
dans ce tutoriel D’entrepôt de données (DWH), vous en apprendrez plus sur-
- historique de Datawarehouse
- Comment fonctionne Datawarehouse?
- Types d’Entrepôt de Données (DWH)
- les étapes Générales de l’Entrepôt de Données
- les Composants de l’entrepôt de Données
- Qui a besoin de l’entrepôt de Données?,
- À quoi sert un entrepôt de données?
- étapes pour implémenter un entrepôt de données
- meilleures pratiques pour implémenter un entrepôt de données
- Pourquoi avons-nous besoin D’un entrepôt de données? Avantages & inconvénients
- L’avenir de L’entreposage de données
- outils D’entrepôt de données
La base de données d’aide à la décision (Data Warehouse) est maintenue séparément de la base de données opérationnelle de l’organisation. Cependant, l’entrepôt de données n’est pas un produit mais un environnement., Il s’agit d’une construction architecturale d’un système d’information qui fournit aux utilisateurs des informations d’aide à la décision actuelles et historiques difficiles d’accès ou présentes dans le magasin de données opérationnelles traditionnel.
Vous savez beaucoup qu’une base de données conçue par 3NF pour un système d’inventaire a beaucoup de tables liées les unes aux autres. Par exemple, un rapport sur les informations d’inventaire actuelles peut inclure plus de 12 conditions jointes. Cela peut rapidement ralentir le temps de réponse de la requête et de rapport., Un entrepôt de données fournit une nouvelle conception qui peut aider à réduire le temps de réponse et contribue à améliorer les performances des requêtes pour les rapports et les analyses.,
entrepôt de Données système est également connu sous le nom suivant:
- Decision Support System (DSS)
- Direction Système d’Information
- Système d’Information de Gestion
- Solution d’Intelligence d’Affaires
- Application Analytique
- Entrepôt de Données
Histoire du Datawarehouse
Le Datawarehouse avantages aux utilisateurs de comprendre et d’améliorer la performance de leur organisation., La nécessité d’entreposer les données a évolué à mesure que les systèmes informatiques devenaient plus complexes et devaient gérer des quantités croissantes d’informations. Toutefois, l’Entreposage de Données n’est pas une chose nouvelle.
Voici quelques événements clés dans l’évolution de L’entrepôt de données –
- 1960 – Dartmouth et General Mills dans un projet de recherche conjoint, développer les Termes dimensions et faits.
- 1970 – a Nielsen et IRI introduisent dimensional data marts pour les ventes au détail.,
- 1983 – Tera Data Corporation introduit un système de gestion de base de données spécialement conçu pour l’aide à la décision
- L’entreposage de données a commencé à la fin des années 1980 lorsque Paul Murphy et Barry Devlin, employés D’IBM, ont développé L’entrepôt de données D’entreprise.
- Cependant, le concept réel a été donné par Inmon projet de Loi. Il était considéré comme un père de l’entrepôt de données. Il avait écrit sur une variété de sujets pour la construction, l’utilisation et la maintenance de l’entrepôt & The Corporate Information Factory.
comment fonctionne Datawarehouse?,
un entrepôt de données fonctionne comme un référentiel central où les informations arrivent d’une ou plusieurs sources de données. Les données circulent dans un entrepôt de données à partir du système transactionnel et d’autres bases de données relationnelles.
Les données peuvent être:
- structuré
- Semi-structuré
- données non structurées
Les données sont traitées, transformées et ingérées afin que les utilisateurs puissent accéder aux données traitées dans L’entrepôt de données via des outils de Business Intelligence, des clients SQL et des feuilles de calcul., Un entrepôt de données fusionne les informations provenant de différentes sources dans une base de données complète.
en fusionnant toutes ces informations en un seul endroit, une organisation peut analyser ses clients de manière plus globale. Cela permet de s’assurer qu’il a pris en compte toutes les informations disponibles. L’entreposage de données rend l’exploration de données possible. L’exploration de données Recherche des modèles dans les données qui peuvent entraîner une augmentation des ventes et des bénéfices.
Types d’Entrepôt de Données
Trois principaux types d’Entrepôts de Données (DWH):
1., Enterprise Data Warehouse (EDW):
Enterprise Data Warehouse (EDW) est un entrepôt centralisé. Il fournit un service d’aide à la décision dans toute l’entreprise. Il offre une approche unifiée pour l’organisation et la représentation des données. Il offre également la possibilité de classer les données en fonction du sujet et de donner accès en fonction de ces divisions.
2. Magasin de données opérationnelles:
Le Magasin de données opérationnelles, également appelé ODS, n’est rien d’autre qu’un magasin de données requis lorsque ni L’entrepôt de données ni les systèmes OLTP ne prennent en charge les besoins de reporting des organisations., Dans ODS, L’entrepôt de données est actualisé en temps réel. Par conséquent, il est largement préféré pour les activités de routine comme le stockage des dossiers des employés.
3. Data Mart:
Un data mart est un sous-ensemble de l’entrepôt de données. Il est spécialement conçu pour un secteur d’activité particulier, tel que les ventes, la finance, les ventes ou la finance. Dans un data mart indépendant, les données peuvent être collectées directement à partir de sources.
étapes générales de L’entrepôt de données
auparavant, les organisations avaient commencé à utiliser l’entreposage de données de manière relativement simple. Cependant, au fil du temps, l’utilisation plus sophistiquée de l’entreposage de données a commencé.,
Voici les étapes générales d’utilisation de L’entrepôt de données (DWH):
base de données opérationnelle hors ligne:
dans cette étape, les données sont simplement copiées d’un système opérationnel vers un autre serveur. De cette façon, le chargement, le traitement et le reporting des données copiées n’affectent pas les performances du système opérationnel.
entrepôt de données hors ligne:
Les données du Datawarehouse sont régulièrement mises à jour à partir de la base de données opérationnelle. Les données dans Datawarehouse sont mappées et transformées pour répondre aux objectifs Datawarehouse.,
entrepôt de données en temps réel:
à cette étape, les entrepôts de données sont mis à jour chaque fois qu’une transaction a lieu dans la base de données opérationnelle. Par exemple, Système de réservation de ligne aérienne ou ferroviaire.
entrepôt de données intégré:
à cette étape, les entrepôts de données sont mis à jour en continu lorsque le système opérationnel effectue une transaction. Le Datawarehouse génère ensuite des transactions qui sont transmises au système opérationnel.
composants de Data warehouse
quatre composants de Data Warehouses sont:
Load manager: Load manager est également appelé le composant frontal., Il effectue toutes les opérations associées à l’extraction et de chargement des données dans l’entrepôt. Ces opérations comprennent des transformations pour préparer les données à entrer dans L’entrepôt de données.
Warehouse Manager: Warehouse manager effectue les opérations associées à la gestion des données dans l’entrepôt. Il effectue des opérations telles que l’analyse des données pour assurer la cohérence, la création d’index et de vues, la génération de dénormalisation et d’agrégations, la transformation et la fusion des données source et l’archivage et la cuisson des données.,
Query Manager: Query manager est également connu sous le nom de Composant backend. Il effectue toutes les opérations d’opération liées à la gestion des requêtes des utilisateurs. Les opérations de ces composants D’entrepôt de données sont des requêtes directes vers les tables appropriées pour planifier l’exécution des requêtes.
l’utilisateur Final d’accéder à des outils:
Ce sont classés en cinq groupes différents comme 1. Communication Des Données 2. Outils De Requête 3. Outils de développement d’applications 4. Outils EIS, 5. Outils OLAP et outils d’exploration de données.
qui a besoin d’un entrepôt de données?,
DWH (Data warehouse) est nécessaire pour tous les types d’utilisateurs comme:
- Les décideurs qui comptent sur une masse de données
- Les utilisateurs qui utilisent des processus complexes et personnalisés pour obtenir des informations à partir de plusieurs sources de données.
- Il est aussi utilisé par les personnes qui veulent simples de la technologie d’accès aux données
- Il est également essentiel pour ceux qui veulent une approche systématique pour la prise de décisions.
- Si l’utilisateur veut des performances rapides sur une énorme quantité de données, ce qui est une nécessité pour les rapports, les grilles ou les graphiques, alors Data warehouse s’avère utile.,
- Data warehouse est une première étape si vous souhaitez découvrir des « modèles cachés » de flux de données et de regroupements.
à quoi sert un entrepôt de données?
ici, sont les secteurs les plus courants où l’entrepôt de données est utilisé:
compagnie aérienne:
dans le système de la compagnie aérienne, il est utilisé à des fins opérationnelles comme l’affectation de l’équipage, l’analyse de la rentabilité des itinéraires, les promotions du programme de fidélisation, etc.
BANQUE:
il est largement utilisé dans le secteur bancaire pour gérer efficacement les ressources disponibles sur desk., Peu de banques ont également utilisé pour l’étude de marché, l’analyse de la performance du produit et des opérations.
soins de santé:
le secteur de la santé a également utilisé Data warehouse pour élaborer des stratégies et prévoir les résultats, générer des rapports de traitement des patients, partager des données avec des compagnies d’assurance liées, des services d’aide médicale, etc.
secteur Public:
Dans le secteur public, l’entrepôt de données est utilisé pour la collecte de renseignements. Il aide les organismes gouvernementaux à tenir et à analyser les dossiers fiscaux, les dossiers de politique de santé, pour chaque individu.,
secteur de L’investissement et de l’assurance:
dans ce secteur, les entrepôts sont principalement utilisés pour analyser les modèles de données, les tendances des clients et pour suivre les mouvements du marché.
conserver la chaîne:
dans les chaînes de vente au détail, L’entrepôt de données est largement utilisé pour la distribution et le marketing. Il permet également de suivre les articles, le modèle d’achat des clients, les promotions et également utilisé pour déterminer la Politique de prix.
Télécommunications:
un entrepôt de données est utilisé dans ce secteur pour les promotions de produits, les décisions de vente et les décisions de distribution.,
industrie hôtelière:
Cette industrie utilise les services d’entrepôt pour concevoir et estimer leurs campagnes de publicité et de promotion là où ils souhaitent cibler les clients en fonction de leurs commentaires et de leurs habitudes de voyage.
étapes pour implémenter Data Warehouse
La meilleure façon de gérer le risque métier associé à une implémentation Datawarehouse est d’utiliser une stratégie à trois volets comme ci-dessous
- stratégie D’entreprise: ici, nous identifions les techniques, y compris l’architecture et les outils actuels. Nous identifions également les faits, les dimensions et les attributs., Le mappage et la transformation des données sont également passés.
- mise en œuvre progressive: la mise en œuvre de Datawarehouse devrait être progressive en fonction des domaines. Les entités commerciales connexes telles que la réservation et la facturation doivent d’abord être implémentées, puis intégrées les unes aux autres.
- prototypage itératif: plutôt qu’une approche big bang de la mise en œuvre, le Datawarehouse devrait être développé et testé de manière itérative.
Voici les étapes clés de la mise en œuvre de Datawarehouse ainsi que ses livrables.,ntegration Map
tr>
meilleures pratiques pour mettre en œuvre un entrepôt de données
- décider d’un plan pour tester la cohérence, l’exactitude et l’intégrité des données.,
- L’entrepôt de données doit être bien intégré, bien définis et horodaté.
- lors de la conception de Datawarehouse, assurez-vous d’utiliser le bon outil, de respecter le cycle de vie, de prendre soin des conflits de données et d’apprendre que vous êtes vos erreurs.
- ne remplacez jamais les systèmes opérationnels et les rapports
- ne passez pas trop de temps à extraire, nettoyer et charger des données.
- s’assurer d’impliquer toutes les parties prenantes, y compris le personnel de L’entreprise, dans le processus de mise en œuvre de Datawarehouse. Établir que L’entreposage de données est un projet conjoint/ d’équipe., Vous ne souhaitez pas créer d’entrepôt de données qui ne soit pas utile aux utilisateurs finaux.
- Préparer un plan de formation pour les utilisateurs finaux.
Pourquoi avons-nous besoin D’un entrepôt de données? Avantages & inconvénients
avantages de L’entrepôt de données (DWH):
- L’entrepôt de données permet aux utilisateurs professionnels d’accéder rapidement aux données critiques de certaines sources en un seul endroit.
- Data warehouse fournit des informations cohérentes sur diverses activités interfonctionnelles. Il prend également en charge les rapports et les requêtes ad hoc.,
- Data Warehouse permet d’intégrer de nombreuses sources de données pour réduire le stress sur le système de production.
- Data warehouse aide à réduire le temps d’exécution total pour l’analyse et le reporting.
- La restructuration et L’intégration facilitent l’utilisation par l’utilisateur pour le reporting et l’analyse.
- Data warehouse permet aux utilisateurs d’accéder aux données critiques à partir du nombre de sources en un seul endroit. Par conséquent, il permet à l’utilisateur de récupérer des données à partir de plusieurs sources.
- entrepôt de Données stocke une grande quantité de données historiques., Cela aide les utilisateurs à analyser différentes périodes et tendances pour faire des prévisions futures.
inconvénients de L’entrepôt de données:
- pas une option idéale pour les données non structurées.
- La création et la mise en œuvre d’un entrepôt de données sont sûrement une affaire déroutante.
- L’entrepôt de données peut être obsolète relativement rapidement
- difficile de modifier les types et les plages de données, le schéma de source de données, les index et les requêtes.
- L’entrepôt de données peut sembler facile, mais en réalité, elle est trop complexe pour l’utilisateur moyen.,
- malgré tous les efforts de gestion de projet, la portée du projet d’entreposage de données augmentera toujours.
- parfois, les utilisateurs de l’entrepôt développeront des règles métier différentes.
- Les Organisations doivent consacrer beaucoup de leurs ressources à la formation et à la mise en œuvre.
L’Avenir de l’Entreposage de Données
- Changement de la Réglementation, contraintes peuvent limiter la capacité de combiner la source de données disparates. Ces sources disparates peuvent inclure des données non structurées qui sont difficiles à stocker.,
- à mesure que la taille des bases de données augmente, les estimations de ce qui constitue une très grande base de données continuent de croître. Il est complexe de construire et d’exécuter des systèmes d’entrepôt de données qui augmentent toujours en taille. Les ressources matérielles et logicielles sont disponibles aujourd’hui ne permettent pas de conserver une grande quantité de données en ligne.
- Les données multimédias ne peuvent pas être facilement manipulées en tant que données textuelles, alors que les informations textuelles peuvent être récupérées par le logiciel relationnel disponible aujourd’hui. Cela pourrait être un sujet de recherche.,
outils D’entrepôt de données
de nombreux outils d’entreposage de données sont disponibles sur le marché. Voici quelques-uns des plus importants:
1. MarkLogic:
MarkLogic est une solution d’entreposage de données utile qui facilite et accélère l’intégration des données en utilisant un éventail de fonctionnalités d’entreprise. Cet outil permet d’effectuer des opérations de recherche très complexes. Il peut interroger différents types de données comme les documents, les relations et les métadonnées.
https://www.marklogic.com/product/getting-started/
2. Oracle:
Oracle est la base de données leader de l’industrie., Il offre un large choix de solutions d’entrepôt de données, tant sur site que dans le cloud. Il permet d’optimiser l’expérience client en augmentant l’efficacité opérationnelle.
https://www.oracle.com/index.html
3. Amazon RedShift:
Amazon Redshift est un outil d’entrepôt de données. Il s’agit d’un outil simple et rentable pour analyser tous les types de données à l’aide de SQL standard et d’outils BI existants. Il permet également d’exécuter des requêtes complexes sur des pétaoctets de données structurées, en utilisant la technique de l’optimisation des requêtes.,
https://aws.amazon.com/redshift/?nc2=h_m1
Voici une liste complète des utiles, des Outils de data warehouse.
KEY LEARNING
- Data Warehouse (DWH), est également connu sous le nom D’entrepôt de données D’entreprise (EDW).
- Un entrepôt de données est défini comme un référentiel central où les informations proviennent d’une ou plusieurs sources de données.
- trois principaux types d’entrepôts de données sont L’entrepôt de données D’entreprise (EDW), le magasin de données opérationnelles et le Data Mart.,
- L’état général d’un datawarehouse est une base de données opérationnelle hors ligne, un entrepôt de données hors ligne, un entrepôt de données en temps réel et un entrepôt de données intégré.
- Les quatre principaux composants de Datawarehouse sont Load manager, Warehouse Manager, Query Manager, End-user access tools
- Datawarehouse est utilisé dans diverses industries telles que les compagnies aériennes, les banques, les soins de santé, les assurances, la vente au détail, etc.
- La mise en œuvre de Datawarehosue est une stratégie à 3 broches à savoir. Stratégie d’entreprise, livraison progressive et prototypage itératif.,
- entrepôt de Données permet aux utilisateurs professionnels d’accéder rapidement à des données critiques de certaines sources en un seul endroit.