Big Data 3 Vs - koncepty a modely

Obsah:

Video: Big Data 3 Vs - koncepty a modely

Video: Big Data 3 Vs - koncepty a modely
Video: USB Redirector Technician Edition - Share usb via vpn teamview 2024, Březen
Big Data 3 Vs - koncepty a modely
Big Data 3 Vs - koncepty a modely
Anonim

Termín "data" není pro nás nový. Je to jedna z hlavních věcí, které se vyučují při výběru informačních technologií a počítačů. Pokud si můžete vzpomenout, data jsou považována za surovou formu informací. Ačkoli už tam po desetiletí, termín Velké údaje je buzz v těchto dnech. Jak je zřejmé z termínu, zatížení a množství dat, je Big Data a může být zpracováno různými způsoby pomocí různých metod a nástrojů pro získání požadovaných informací. Tento článek hovoří o pojmech Big Data s využitím 3 V, o kterém se zmiňuje Doug Laney, průkopník v oblasti datového skladování, který je považován za průkopníka oboru Infonomics (Informační ekonomika).

Než budete pokračovat, možná budete chtít přečíst naše články o zásadách velkých dat a využití velkých dat, abyste pochopili podstatu. Mohli by se přidat k tomuto příspěvku pro další vysvětlení konceptu Big Data.
Než budete pokračovat, možná budete chtít přečíst naše články o zásadách velkých dat a využití velkých dat, abyste pochopili podstatu. Mohli by se přidat k tomuto příspěvku pro další vysvětlení konceptu Big Data.

Velká data 3 Vs

Data, v její obrovské podobě, nahromaděná různými prostředky, byla v různých databázích uložena správně dříve a po nějaké době byla vyhozena. Když se objevila koncepce, že čím více dat, tím jednodušší je zjistit - různé a relevantní informace - pomocí správných nástrojů, společnosti začaly ukládat data po delší dobu. Je to jako přidání nových úložných zařízení nebo použití cloud pro ukládání dat v jakékoli podobě, jakou byla data získána: dokumenty, tabulky, databáze a HTML atd. Je pak uspořádáno do správných formátů pomocí nástrojů schopných zpracovávat obrovské kousky Data.

POZNÁMKA: Rozsah velkých dat není omezen na data, která shromažďujete a ukládáte ve svých prostorách a cloudu. Může obsahovat data z různých jiných zdrojů, včetně, ale nikoliv pouze, položek ve veřejné doméně.

3D model velkých dat je založen na následujících V:

  1. Hlasitost: odkazuje na správu ukládání dat
  2. Rychlost: odkazuje na rychlost zpracování dat
  3. Rozmanitost: odkazuje na seskupování dat různých, zdánlivě nesouvisejících datových sad

Následující odstavce vysvětlují modelování Big Data tím, že podrobněji mluví o každé dimenzi (každý V).

A] Objem velkých dat

Když mluvíme o Big Data, člověk by mohl chápat objem jako obrovskou sbírku surových informací. I když to platí, jedná se také o náklady na ukládání dat. Důležitá data mohou být uložena v prostorách i v cloudu, což je flexibilní volba. Potřebujete ale ukládat vše a všechno?

Podle whitepaperu vydané společností Meta Group, kdy se objem dat zvyšuje, části dat začnou vypadat zbytečně. Dále uvádí, že by měl být zachován pouze tento objem údajů, který podniky zamýšlejí používat. Jiné údaje mohou být zlikvidovány, nebo pokud se podniky zdráhají zbavit "údajně nedůležitých údajů", mohou být na nepoužívané počítačové zařízení a dokonce i na páscích vyhazovány, aby podniky nemusely platit za ukládání těchto údajů.

Použil jsem "údajně nevýznamné údaje", protože i já se domnívám, že jakákoliv data mohou být v budoucnu požadována jakýmkoli typem - dříve či později - a proto musí být uchovávána dostatečně dlouho, než víte, že data jsou skutečně nevýznamné. Osobně jsem odložil starší data na pevné disky od dávných dob a někdy i na DVD. Hlavní počítače a cloud storage obsahují data, která považuji za důležitá a vědí, že budu používat. Mezi těmito daty existuje i druh dat, které mohou po několika letech skončit na starém HDD. Výše uvedený příklad je jen pro vaše pochopení. To nebude odpovídat popisu Big Data, protože částka je mnohem méně ve srovnání s tím, co podniky vnímají jako Big Data.

B ] Rychlost ve velkých datech

Rychlost zpracování dat je důležitým faktorem, když mluvíme o konceptech Big Data. Existuje mnoho webových stránek, zejména e-commerce. Google již připustil, že rychlost, s jakou je zatížení stránky zásadní pro lepší hodnocení. Kromě žebříčku poskytuje rychlost i uživatelům pohodlí při nakupování. Totéž platí pro data zpracovávaná pro další informace.

Zatímco mluvíme o rychlosti, je nezbytné vědět, že je nad rámec prosté vyšší šířky pásma. Kombinuje snadno použitelné údaje s různými analytickými nástroji. Snadno použitelné údaje znamenají nějaké domácí úkoly pro vytvoření struktur dat, které lze snadno zpracovat. Další rozměr - Variety, rozšiřuje další světlo.

C] Rozmanitost velkých dat

Pokud jsou načteny a spousta dat, je důležité je uspořádat tak, aby analytické nástroje mohly snadno zpracovávat data. K dispozici jsou také nástroje pro organizaci dat. Při ukládání mohou být data nestrukturovaná a jakékoli formy. Je na vás, abyste zjistili, jaký vztah má s vámi další data. Jakmile zjistíte vztah, můžete vyzdvihnout příslušné nástroje a převést data do požadované formy pro strukturované a tříděné úložiště.

Image
Image

souhrn

Jinými slovy, 3D model Big Data je založen na třech rozměrech: údaje USABLE, které vlastníte; řádné značení dat; a rychlejší zpracování. Pokud se o tyto tři postaráte, mohou být vaše údaje snadno zpracovány nebo analyzovány, aby zjistili, co chcete.

Výše vysvětluje oba koncepty a 3D model Big Data. Články spojené v druhém odstavci prokáží dodatečnou podporu, pokud jste novým konceptem.

Pokud chcete něco přidat, napište komentář.

Doporučuje: