Zalecane, 2019

Wybór Redakcji

Różnica między tabelą faktów a tabelą wymiarów

Tabela faktów i tabela wymiarów są niezbędnymi czynnikami do stworzenia schematu . Rekord tabeli faktów jest kombinacją atrybutów z różnych tabel wymiarów. Tabela faktów pomaga użytkownikowi w analizie wymiarów biznesowych, które pomagają mu w podejmowaniu decyzji w celu usprawnienia działalności. Z drugiej strony tabele wymiarów pomagają w zbieraniu wymiarów, w których należy podjąć działania.

Punktem odróżniającym tabelę Fakt i tabelę wymiarów jest to, że tabela wymiarów zawiera atrybuty, wzdłuż których pomiary są wykonywane w tabeli faktów . Istnieje kilka innych czynników, które powodują różnice między tabelą faktów i tabelą wymiarów, aby je wyświetlić. Przyjrzyjmy się poniższemu wykresowi porównawczemu.

Wykres porównania

Podstawa do porównaniaTabela faktówTabela wymiarów
PodstawowyTabela faktów zawiera pomiar wzdłuż atrybutów tabeli wymiarów.Tabela wymiarów zawiera atrybuty, wzdłuż których tabela faktów oblicza dane.
Atrybuty i rekordyTabela faktów zawiera mniej atrybutów i więcej rekordów.Tabela wymiarów zawiera więcej atrybutów i mniej rekordów.
Rozmiar tabeliTabela faktów rośnie pionowo.Tabela wymiarów rośnie poziomo.
KlawiszTabela faktów zawiera klucz podstawowy, który jest konkatenacją kluczy podstawowych wszystkich tabel wymiarów.Każda tabela wymiarów zawiera swój klucz podstawowy.
kreacjaTabela faktów może zostać utworzona tylko po zakończeniu tworzenia tabel wymiarów.Tabele wymiarów należy najpierw utworzyć.
SchematSchemat zawiera mniejszą liczbę tabel faktów.Schemat zawiera więcej tabel wymiarów.
AtrybutyTabela faktów może zawierać dane zarówno w formacie numerycznym, jak i tekstowym.Tabela wymiaru zawsze zawiera atrybuty w formacie tekstowym.

Definicja tabeli faktów

Tabela faktów to tabela zawierająca pomiary wzdłuż atrybutów tabel wymiarów. Może zawierać informacje na najniższym możliwym poziomie. Niektóre tabele faktów zawierają tylko dane zbiorcze, zwane tabelami agregowanych faktów . Tabela faktów prawie zawiera dane oznaczone datą . Omówmy cechy tabeli faktów.

Konkatenowany klucz
Tabela faktów zawiera łączony klucz, który jest połączeniem kluczy podstawowych wszystkich tabel wymiarów. Połączony klucz tabeli faktów musi jednoznacznie identyfikować wiersz w tabeli faktów.

Data Grain
Ziarno danych pokazuje, jak głęboko przechowywane są tablice pomiarów w rzeczywistości. Ziarno danych musi być na możliwie najwyższym poziomie.

Środki dodatkowe
Atrybuty tabeli faktów mogą być w pełni addytywne lub półdodatnie . W pełni addytywne są te, które można łatwo podsumować dla wszystkich tabel wymiarów. Na przykład quantity_ordered, jest atrybutem, który można podsumować dla wszystkich wymiarów. Możemy pobrać całkowitą ilość_konta, dla konkretnego klienta, regionu, daty, marki itp. Środki półdodatkowe to takie, które można zsumować wzdłuż niektórych wymiarów tabeli faktów, ale nie wszystkich wymiarów. Nie można podsumować kwoty salda w czasie, ponieważ zmienia się w czasie.

Rzadkie dane
Czasami możemy zobaczyć rekordy w tabeli faktów, które mają atrybuty z zerowymi miarami . Na przykład może nie być żadnej kolejności na święta. Tak więc atrybuty dla tej daty będą miały zerowe miary. Nie musimy przechowywać miar dla tego rodzaju rekordów, ponieważ nie dostarcza żadnych informacji.

Zdegenerowane wymiary
Czasami możesz natknąć się na kilka wymiarów tabeli faktów, które nie są w ogóle addytywne. Na przykład order_number, customer_id, nie możesz dodać tych typów wymiarów. Jednak w przypadku, musisz znaleźć zamówienie złożone przez konkretnego klienta w tym miesiącu; wtedy będziesz potrzebować customer_id, aby odnieść swoje wyszukiwanie. Te typy, jeśli atrybuty lub wymiary tabeli faktów nazywają się Zwymiarowany wymiar .

Definicja tabeli wymiarów

Tabela wymiarów jest kluczowym składnikiem Start Schema. Tabela wymiarów zawiera atrybuty reprezentujące wymiary, wzdłuż których pomiar jest wykonywany w tabeli faktów. Ponadto omówimy niektóre cechy tabeli wymiarów.

Atrybuty i klucze
Każda tabela wymiaru musi mieć klucz podstawowy, który jednoznacznie identyfikuje każdy rekord tabeli. Powszechnie obserwuje się, że tabela wymiarów zawiera wiele atrybutów. Dlatego wydaje się, że jest szeroki, tzn. Gdy tworzysz tabelę wymiarów, znajdziesz ją rozciągającą się poziomo .

Wartości atrybutów
Wartości atrybutów w tabeli wymiarów są rzadko numeryczne, większość czasu, w którym można znaleźć wartości w atrybutach, są w formacie tekstowym . Na przykład nazwa produktu, marka, kategoria, podkategoria itp.

Relacja między atrybutami
Często można zauważyć, że atrybuty napotkane w tabeli wymiarów nie są bezpośrednio powiązane. Podobnie jak Product_brand nie ma nic wspólnego z parametrem data_pakietu, ale nadal oba mogą być atrybutami tabeli wymiarów produktu.

Normalizacja
Tabela wymiarów nie powinna być znormalizowana . Wynika to z faktu, że normalizacja tabeli tworzy wiele pośrednich tabel. Gdy zapytanie pobiera atrybut z tabeli wymiarów i odzyskuje pomiary wzdłuż tego dla tabeli faktów, zapytanie musi przejść przez te pośrednie tabele, które stają się nieefektywne. Dlatego tabele wymiarów nie są znormalizowane.

Wiercenie w dół, zwijanie
Atrybuty tabeli wymiarów pozwalają uzyskać szczegółowe informacje poprzez przechodzenie z wyższego poziomu zagregowanych atrybutów do atrybutów niższego poziomu. Na przykład, jeśli chcesz znaleźć całkowitą sprzedaż w danym regionie, możesz przećwiczyć sprzedaż według stanu, miasta, zip. Możesz nawet zrolować, aby znaleźć całkowitą sprzedaż najpierw przez zip, a następnie przez miasto, a następnie stan.

Wielokrotna hierarchia
Często tabela wymiarów oferuje wiele hierarchii. Na przykład mamy tabelę wymiarów produktów dla sklepu departamentów. Teraz mamy dwa działy dział marketingu i księgowości.

Dział marketingu przeszukuje atrybuty tabeli wymiarów produktów w pewnej hierarchii, aby uzyskać pomiary dla tabeli faktów.

Z drugiej strony, dział księgowości przejdzie między atrybuty tabeli wymiarów produktów w różnych hierarchiach, aby uzyskać pomiary dla tabeli faktów.

Dlatego tabela wymiarów musi mieć wiele hierarchii lub poziomu agregacji atrybutów, aby umożliwić użytkownikowi drążenie w dół w dowolnej z wielu hierarchii.

Dokumentacja
Chociaż tabela wymiarów ma zbyt wiele atrybutów, ma mniejszą liczbę rekordów.

Kluczowe różnice między tabelą faktów a tabelą wymiarów

  1. Tabela faktów zawiera pomiary wzdłuż wymiaru / atrybutów tabeli wymiarów.
  2. Tabela faktów zawiera więcej rekordów i mniej atrybutów w porównaniu do tabeli wymiarów, natomiast tabela wymiarów zawiera więcej atrybutów i mniej rekordów.
  3. Rozmiar tabeli faktów rośnie pionowo, natomiast rozmiar tabeli wymiarów rośnie poziomo.
  4. Każda tabela wymiarów zawiera klucz podstawowy do identyfikacji każdego rekordu w tabeli, natomiast tabela faktów zawiera połączony klucz, który jest kombinacją wszystkich kluczy podstawowych wszystkich tabel wymiarów.
  5. Tabela wymiarów musi zostać zarejestrowana przed utworzeniem tabeli faktów.
  6. Schemat zawiera mniej tabel faktów, ale więcej tabel wymiarów.
  7. Atrybuty w tabeli faktów są zarówno numeryczne, jak i tekstowe, ale atrybuty tabeli wymiarów mają tylko atrybuty tekstowe.

Wniosek:

Oba są równie ważne dla tworzenia schematu, ale tabela wymiarów musi być zapisana przed tabelą faktów. Ponieważ niemożliwe jest utworzenie tabeli faktów bez wymiarów.

Top