Mówiąc prosto, platforma danych to ograniczona przestrzeń danych, której dane można uzyskać poprzez podsumowywanie i wybieranie danych z hurtowni danych lub za pomocą odrębnych procesów ekstrakcji, przekształcania i ładowania z systemu danych źródłowych.
Wykres porównania
Podstawa do porównania | Hurtownia danych | Data Mart |
---|---|---|
Podstawowy | Hurtownia danych jest niezależna od aplikacji. | Data mart są specyficzne dla aplikacji systemu wspomagania decyzji. |
Rodzaj systemu | Scentralizowane | Zdecentralizowany |
Forma danych | Szczegółowy | Streszczony |
Zastosowanie denormalizacji | Dane są nieco zdenormalizowane. | Dane są wysoce zdenormalizowane. |
Model danych | Z góry na dół | Od dołu |
Natura | Elastyczny, zorientowany na dane i długa żywotność. | Restrykcyjny, zorientowany na projekt i krótki okres użytkowania. |
Typ zastosowanego schematu | Konstelacja faktów | Gwiazda i płatek śniegu |
Łatwość budowania | Trudny do zbudowania | Prosty w budowie |
Definicja hurtowni danych
Termin magazyn danych oznacza zmienną w czasie, zorientowaną na przedmiot, nieulotną i zintegrowaną grupę danych, które wspomagają proces decyzyjny zarządzania. Alternatywnie jest to repozytorium informacji zebranych z wielu źródeł, przechowywanych w ujednoliconym schemacie, w jednej lokacji, która umożliwia integrację różnych systemów aplikacji. Po zebraniu tych danych jest on przechowywany przez długi czas, dlatego ma długą żywotność i umożliwia dostęp do informacji historycznych .
W związku z tym hurtownia danych zapewnia użytkownikowi jeden zintegrowany interfejs do danych, dzięki któremu użytkownik może łatwo pisać zapytania dotyczące wspomagania decyzji. Hurtownia danych pomaga przekształcić dane w informacje. Projektowanie hurtowni danych obejmuje podejście odgórne.
Gromadzi informacje o tematach obejmujących całą organizację, takich jak klienci, sprzedaż, aktywa, przedmioty, a zatem jej zasięg obejmuje całe przedsiębiorstwo. Zasadniczo stosuje się w nim schemat konstelacji faktów, który obejmuje szeroki zakres tematów. Hurtownia danych nie jest strukturą statyczną i stale się rozwija .
Definicja Data Mart
Martenę danych można nazwać podzbiorem hurtowni danych lub podgrupą danych korporacyjnych odpowiadających pewnej grupie użytkowników. Hurtownia danych obejmuje kilka oddziałowych i logicznych baz danych, które muszą być trwałe na swoich ilustracjach danych, aby zapewnić solidność hurtowni danych. Baza danych to zestaw tabel, które koncentrują się na jednym zadaniu, które zostały zaprojektowane przy użyciu podejścia oddolnego.
Ponieważ schematy gwiazda i płatek śniegu są ukierunkowane na modelowanie pojedynczego obiektu, dlatego są one powszechnie stosowane w hurtowni danych. Chociaż schemat gwiazd jest bardziej popularny niż schemat płatka śniegu. W zależności od źródła danych bazy danych można podzielić na dwa typy: zależne i niezależne marty z danymi.
Kluczowe różnice między hurtownią danych a bazą danych
- Hurtownia danych jest niezależna od aplikacji, podczas gdy serwer danych jest specyficzny dla aplikacji systemu wspomagania decyzji.
- Dane są przechowywane w jednym, scentralizowanym repozytorium w hurtowni danych. W przeciwieństwie do tego, hurtownia danych przechowuje dane w sposób zdecentralizowany w obszarze użytkownika.
- Hurtownia danych zawiera szczegółową formę danych. W przeciwieństwie do danych mart zawiera dane podsumowane i wybrane.
- Dane w hurtowni danych są nieco zdenormalizowane, natomiast w przypadku Data mart jest wysoce zdenormalizowany.
- Budowa hurtowni danych obejmuje podejście odgórne . I odwrotnie, podczas budowy bazy danych stosuje się podejście oddolne.
- Hurtownia danych ma elastyczny, zorientowany na informacje i długotrwały charakter. Wręcz przeciwnie, platforma danych jest restrykcyjna, zorientowana na projekt i ma krótszą egzystencję.
- Schemat konstelacji faktów jest zwykle używany do modelowania hurtowni danych, natomiast w schemacie map danych mart jest bardziej popularny.
Wniosek
Hurtownia danych zapewnia widok korporacyjny, pojedynczy i scentralizowany system pamięci masowej, architekturę wewnętrzną i niezależność od aplikacji, a Data mart to podzbiór hurtowni danych, która zapewnia zdecentralizowane przechowywanie w widoku działu. Ponieważ hurtownia danych jest bardzo duża i zintegrowana, ma duże ryzyko niepowodzenia i trudności w jej budowie. Z drugiej strony, baza danych jest łatwa do zbudowania, a związane z nią ryzyko awarii jest również mniejsze, ale w przypadku hurtowni danych może wystąpić rozdrobnienie.