Obejmuje on model wejścia, przetwarzania i produkcji, wyjaśniony poniżej; diagram ilustruje szczegółowo związek między przetwarzaniem w chmurze a dużymi danymi.
Wykres porównania
Podstawa do porównania | Chmura obliczeniowa | Big Data |
---|---|---|
Podstawowy | Usługi na żądanie są świadczone przy użyciu zintegrowanych zasobów i systemów komputerowych. | Rozbudowany zestaw uporządkowanych, niestrukturalnych, złożonych danych, zabraniających tradycyjnej techniki przetwarzania do pracy nad nim. |
Cel, powód | Włącz dane, które mają być przechowywane i przetwarzane na zdalnym serwerze i dostępne z dowolnego miejsca. | Organizacja dużej ilości danych i informacji do wyciągu ukryta cenna wiedza. |
Pracujący | przetwarzanie rozproszone służy do analizy danych i tworzenia bardziej przydatnych danych. | Internet służy do świadczenia usług w chmurze. |
Zalety | Niskie koszty utrzymania, scentralizowana platforma, możliwość tworzenia kopii zapasowych i odzyskiwania danych. | Ekonomiczny paralelizm, skalowalność, solidność. |
Wyzwania | Dostępność, transformacja, bezpieczeństwo, model obciążania. | Różnorodność danych, przechowywanie danych, integracja danych, przetwarzanie danych i zarządzanie zasobami. |
Definicja Cloud Computing
Przetwarzanie w chmurze zapewnia zintegrowaną platformę usług do przechowywania i pobierania dowolnej ilości danych w dowolnym momencie z dowolnego miejsca na żądanie przy użyciu szybkiego Internetu. Chmura to szeroki zestaw serwerów naziemnych rozproszonych w Internecie w celu przechowywania, zarządzania i przetwarzania danych. Chmura obliczeniowa została opracowana w taki sposób, aby programiści mogli łatwo wdrożyć obliczenia w skali internetowej. Ewolucja Internetu stała się modelem cloud computing, ponieważ Internet jest podstawą chmury obliczeniowej. Aby sprawnie pracować w chmurze, potrzebujemy szybkiego połączenia z Internetem. Oferuje elastyczne środowisko, w którym pojemność i możliwości mogą być dynamicznie dodawane i wykorzystywane zgodnie ze strategią płacenia za używanie.
Przetwarzanie w chmurze ma kilka istotnych właściwości, takich jak łączenie zasobów, samoobsługa na żądanie, szeroki dostęp do sieci, mierzona obsługa i szybka elastyczność. Istnieją cztery rodzaje chmury - publiczna, prywatna, hybrydowa i społeczność.
Zasadniczo istnieją trzy modele przetwarzania w chmurze - Platform as a Service (Paas), Infrastructure as a Service (Iaas), Software as a Service (Saas), które korzystają zarówno ze sprzętu, jak i oprogramowania.
- Infrastruktura jako usługa - ta usługa służy do dostarczania infrastruktury, która obejmuje moc przetwarzania pamięci masowej i maszyny wirtualne. Wdraża wirtualizację zasobów na podstawie umowy o poziomie usług (SLA).
- Platforma jako usługa - Jest nad warstwą IaaS, która zapewnia programowanie i środowisko wykonawcze, aby umożliwić użytkownikom wdrażanie aplikacji w chmurze.
- Oprogramowanie jako usługa - dostarcza aplikacje do klienta, który jest bezpośrednio uruchamiany przez dostawcę usług w chmurze.
Definicja dużych zbiorów danych
Dane zamieniają się w duże dane ze wzrostem objętości, różnorodności, prędkości, poza możliwościami systemów informatycznych, które z kolei generują trudności w przechowywaniu, analizowaniu i przetwarzaniu danych. Niektóre organizacje opracowały sprzęt i wiedzę specjalistyczną, aby poradzić sobie z tego typu ogromną ilością danych strukturalnych, ale wykładniczo rosnące wolumeny i szybki przepływ danych przerywają zdolność do ich wydobywania i natychmiastowego generowania odpowiednich danych wywiadowczych. Te obszerne dane nie mogą być przechowywane w zwykłych urządzeniach i rozproszone w rozproszonym środowisku. Big data computing to wstępna koncepcja nauki o danych, która koncentruje się na wielowymiarowym wydobywaniu informacji dla odkryć naukowych i analiz biznesowych na dużą skalę.
Podstawowe wymiary dużych danych to objętość, prędkość, różnorodność i prawdomówność, które są również wspomniane powyżej, później powstają dwa kolejne wymiary, które są zmiennością i wartością.
- Wolumen - oznacza rosnący rozmiar danych, których przetwarzanie i przechowywanie jest już problematyczne.
- Prędkość - Jest to przypadek, w którym dane są przechwytywane i szybkość przepływu danych.
- Odmiana - dane nie prezentują się w jednym formularzu zawsze, istnieją różne formy danych, na przykład - tekst, dźwięk, obraz i wideo.
- Wiarygodność - określana jako wiarygodność danych.
- Zmienność - opisuje wiarygodność, złożoność i niespójności powstające w dużych danych.
- Wartość - oryginalna forma zawartości może nie być zbyt użyteczna i produktywna, więc dane są analizowane, a dane o wysokiej wartości są odkrywane.
Kluczowe różnice między przetwarzaniem w chmurze a Big Data
- Przetwarzanie w chmurze to usługa komputerowa dostarczana na żądanie przy użyciu zasobów komputerowych rozproszonych w Internecie. Z drugiej strony, duże zbiory danych to ogromny zbiór danych komputerowych, w tym dane strukturalne, niestrukturalne, półstrukturalne, które nie mogą być przetwarzane przez tradycyjne algorytmy i techniki.
- Przetwarzanie w chmurze stanowi platformę dla użytkowników do korzystania z usług takich jak Saas, Paas i Iaas, na żądanie, a także pobiera opłaty za usługę zgodnie z użytkowaniem. Natomiast głównym celem dużych zbiorów danych jest wydobycie ukrytej wiedzy i wzorców z ogromnej kolekcji danych.
- Szybkie łącze internetowe to podstawowy warunek chmury obliczeniowej. W przeciwieństwie do tego, duże dane wykorzystują przetwarzanie rozproszone w celu analizy i pozyskiwania danych.
Związek między przetwarzaniem w chmurze a dużymi danymi
Poniższy schemat ilustruje relację i działanie chmury obliczeniowej z dużymi danymi. W tym modelu podstawowy model przetwarzania danych wejściowych, przetwarzania i wydruku jest używany jako odniesienie, w którym duże dane są wstawiane do systemu za pomocą urządzeń wejściowych, takich jak mysz, klawiatura, telefony komórkowe i inne inteligentne urządzenia. Drugi etap przetwarzania obejmuje narzędzia i techniki używane przez chmurę do świadczenia usług. W końcu wynik przetwarzania jest dostarczany użytkownikom.
Wniosek
Technologia przetwarzania w chmurze zapewnia odpowiednią i zgodną platformę dla dużych zbiorów danych dzięki łatwości użycia, dostępowi do zasobów, niskim kosztom wykorzystania zasobów na podaży i na żądanie, a także minimalizuje wykorzystanie stałego sprzętu wykorzystywanego do obsługi dużych zbiorów danych. Zarówno chmura, jak i duże zbiory danych kładą nacisk na zwiększenie wartości firmy przy jednoczesnym obniżeniu kosztów inwestycji.