Co kdyby organizace zpracovávaly všechna svá data na podporu rozhodování? Co by se stalo, kdyby použili specializovaný software, který sloužil k prezentaci informací a jejich analýze? Nějaké dáme Příklady datového skladu odpovědět na tyto otázky.

Příklady datového skladu
V první řadě je důležité rozlišovat mezi dvěma termíny, které nás díky své zkratce mohou snadno zmást, a od začátku je záměrem, aby uživatel věděl, co může očekávat, a aby poznal některé základní pojmy, do kterých jde. čelit. Zde si ukážeme nekonečné příklady, které slouží k tomu, aby jedinec měl nástroje k rozlišení těchto prvků.
Definice
Vzhledem k rozdílu mezi těmito dvěma termíny přistoupíme k jejich formální definici, protože se jedná o proces, který získává, transformuje, konsoliduje a integruje data organizace, interní i externí, aby byla přístupná a užitečná při rozhodování -výroba.
Stejným způsobem lze datový sklad definovat také jako základnu s informacemi o elektronickém systému souborů, která ukládá data nezbytná pro analýzu informací a rozhodování. Jeho rozdíl je v tom, že je obchodně orientovaný, integrovaný, časově proměnlivý a energeticky nezávislý.
Data Warehousing (DWH) je v zásadě proces a Data Warehouse (DW) je databáze.
Rysy
Datový sklad charakterizuje několik aspektů, které poskytují potřebné nástroje pro jeho optimální využití, a jsou tak v souladu s naprogramovanými pokyny, které generují nástroje pro jeho použití nejlepším možným způsobem. Podrobně popíšeme vlastnosti datového skladu:
Obchodní orientace
Do datového skladu se zadávají pouze relevantní data pro analýzu a rozhodování. To znamená, že se neberou v úvahu data, která nemají analytickou hodnotu, například adresy pokojů, poštovní směrovací čísla, e -mailové adresy. Ale mají různorodý zájem, jako je typ klienta, geografická poloha, věk atd.
Jsou spravovány entity na vysoké úrovni, jako jsou klienti, produkty, položky, oblasti a další. Data jsou ukládána vícerozměrným způsobem, tj. Ve skutečnosti a tabulkami dimenzí.
Integrovaný
Všechna data z heterogenních zdrojů jsou konsolidována, aby byla zaručena jejich kvalita a čistota. Hlavními zdroji dat jsou:
Podle typu uživatele.
-
- Provozní: Daily produkuje velké množství dat, ale samy o sobě mají malý význam pro požadovanou analýzu. Například prodej produktů.
- Střední: Generuje data s implikací v krátkodobém a střednědobém horizontu na základě provozních údajů. Dobrým příkladem tohoto konceptu je generování zásob.
- Manažerské: Používá data vyplývající z procesu integrace a transformace. Na druhé straně generuje nové informace. V zásadě se týká uživatele datového skladu.
Podle oblasti nebo oddělení organizace
-
- Oblasti: Každý z nich má dobře definované odpovědnosti. Produkují svá vlastní data, která jsou sdílena s ostatními oblastmi.
- Členění: Obvykle jsou geografické. Poskytují údaje o poloze, které je třeba začlenit společně s ostatními.
Podle zdroje
-
- Interní: Vytvářejí vlastní data pocházející z každodenních činností společnosti.
- Externí: Doplňují interní data, například sčítání a statistiky.
Varianta v čase
Umožňuje přístup k různým verzím stejné situace, protože aktuální data jsou uložena společně s historickými daty v příkladech datového skladu.

Není těkavý
Zaručuje stabilitu informací, protože jakmile data vstoupí, nezmění se. To znamená, že s daty je manipulováno pouze při jejich zadávání a při konzultaci.
Stručně řečeno, hlavní vlastnosti datového skladu jsou:
Vlastnosti
Zpracovává data v objemu, což je důsledek akumulace historických, aktuálních a agregovaných dat, z různých zdrojů.
Umístí celý objem dat do jediné centralizované databáze. Strukturujte data multidimenzionálním způsobem.
výhody
Díky svým vlastnostem a vlastnostem Data Warehouse přináší následující výhody:
- Snižuje minimální čas potřebný ke shromažďování všech relevantních dat na konkrétní téma.
- Poskytuje analytické nástroje.
- Mnoho zpráv a analýz je definováno uživatelem.
- Umožňuje vám přímý přístup, analýzu a sledování indikátorů organizace.
- Pomáhá identifikovat faktory, které ovlivňují chod společnosti.
- Umožňuje postupovat a určovat budoucí chování instituce.
- Uživatelé mohou na data rychle a snadno zadávat dotazy.
Data Warehouse zkrátka pomáhá organizaci zodpovědět zásadní otázky pro rozhodování. Tím se dosáhne konkurenčních výhod, které optimalizují jejich pozici na trhu, na kterém působí. Některé z těchto otázek jsou:
- Jaký je profil klientů?
- Jaké je jejich chování?
- Jaká je ziskovost podnikání?
- Jaké je riziko pro organizaci?
- Jaké služby a produkty používáte a jak je můžete zvýšit?
Oblast použití
Datový sklad lze přizpůsobit jakékoli organizaci bez ohledu na jeho velikost a složitost. To je důsledek agendy jakékoli instituce, společnosti nebo organizace při přijímání příslušných rozhodnutí ohledně dat, která vytváří.
Rizika aplikace
Vyžaduje velké investice ze strany organizace. Přínosy jeho implementace nejsou vidět v krátkodobém, ale střednědobém a dlouhodobém horizontu.
Manipulace s daty ohrožuje manipulaci s citlivými daty.
Aspekty, které je třeba vzít v úvahu
Jak již bylo zmíněno na začátku, existuje několik aspektů, které je třeba vzít v úvahu při aplikaci těchto prvků pro použití serveru. Mezi nimi můžeme zmínit následující:
Náklady na aplikaci
Datový sklad nese náklady na výstavbu, provoz a podporu. Náklady na výstavbu zahrnují náklady na lidské zdroje, čas a technologii, zatímco náklady na provoz a údržbu zohledňují náklady na vývoj, růst a náklady způsobené změnami v původu dat.
Dopad na lidi
Aplikace datového skladu vždy generuje očekávání u uživatelů, kteří budou nutně muset získat nové dovednosti. Úspěch tohoto typu dat závisí na aktivním používání a zpětné vazbě od uživatelů.
Dopad na obchodní a rozhodovací procesy
S použitím datového skladu lze odhalit určité nedostatky v obchodních procesech, ale zároveň se zvyšuje důvěra v rozhodnutí přijatá na základě jeho výsledků.
Architektura
Obecná architektura ukázkového datového skladu je znázorněna na obrázku výše. Jak je vidět, tento systém zahrnuje řadu interakcí mezi jeho komponentami. V tomto ohledu a jako shrnutí lze jeho fungování popsat následovně:
- Data jsou převzata z různých zdrojů, jako jsou webové služby, soubory a další databáze, interní i externí.
- Jakmile jsou data extrahována, jsou integrována, transformována a vyčištěna, aby byla později načtena do Data Warehouse.
- Za účelem generování taktických a strategických informací jsou ze načítání dat získávány zprávy a analýzy.
- Nakonec mohou uživatelé konzultovat a prozkoumávat generované zprávy a analýzy.
prvky
Nyní popíšeme některé prvky, které lze vyhodnotit v datovém skladu a které by měly být zváženy.
Zdroje datového skladu
Obecně jsou výsledkem každodenní činnosti společnosti, v takovém případě se jim říká interní zdroje. Když jsou data převzata například z webových serverů, jsou považována za externí zdroje. Liší se navzájem, protože závisí na jejich původu, formátu, funkci atd.
Extrakce, transformace a načítání
Známý jako ETL, je to proces, který zahrnuje všechny úkoly, které se provádějí od okamžiku, kdy jsou data získána, dokud nejsou načtena do Data Warehouse. Jsou to: extrakce, manipulace, ovládání, integrace, čištění dat, načítání a aktualizace.
Těžba
Obsahuje techniky zaměřené na získávání pouze příslušných dat z různých zdrojů a jejich uchovávání v interním úložišti. Tento typ úložiště umožňuje manipulaci s daty, aniž by bylo nutné zasahovat nebo měnit zdroje nebo datový sklad s více daty, vytvářet extrakční vrstvu mezi čtením a načítáním, ukládáním a správou metadat generovaných v procesu a usnadněním integrace.
Extrakce je založena na potřebách uživatelů a požadavcích definovaných pro řešení.
Proměna
Toto jsou techniky, které zajišťují kompatibilitu různých formátů, filtrování a klasifikaci dat a související zdroje.
Tato funkce je zodpovědná za použití všech příslušných příkazů ve vztahu k datům za účelem jejich propagace silným a rozumným způsobem, který je kompatibilní a konzistentní s Data Warehouse. Kromě toho odpovídá za čistotu a kvalitu dat.

Carga
Pokud jde o techniky počátečního načítání dat a pravidelné aktualizace datového skladu.
- Počáteční načtení se týká prvního načtení dat, která Data Warehouse obdrží. Obecně je to časově velmi náročné kvůli velkému počtu záznamů patřících do dlouhých časových období.
- Pravidelná aktualizace se týká vkládání malých objemů dat. Vaším cílem je přidat do ukázek datového skladu pouze ta data, která jsou generována z poslední aktualizace. Záleží na potřebách a požadavcích uživatele.
Stručně řečeno, procesem načítání dat je údržba datového skladu zaručena.
Souhrnně lze říci, že proces ETL se provádí následovně:
- Data, jakmile jsou extrahována z příslušných zdrojů, jsou uložena ve vnitřním úložišti.
- Data jsou uložena ve vnitřním úložišti, jsou integrována a transformována.
- Když jsou data vyčištěna, po předchozím kroku jsou předána do datového skladu.
Zprávy
Zprávy jsou grafické nástroje, které uživateli umožňují získat podrobné zprávy o informacích o jejich společnosti. Způsob interakce s těmito sestavami je pro uživatele velmi jednoduchý, protože jde o snadno srozumitelné pokyny. V zásadě musíte vybrat možnosti z nabídky podle podmínek a specifikací předloženého tématu.
OLAP
Je to nejsilnější součást Data Warehouse, protože obsahuje specializovaný vícerozměrný modul dotazů systému.
Umožňuje analýzu organizace z různých historických scénářů. Promítá své chování a vývoj z vícerozměrné vize, tedy kombinací různých perspektiv, témat zájmu nebo dimenzí. To umožňuje odvodit trendy objevením vztahů mezi perspektivami, které by bylo na první pohled obtížné najít.
Data Mining
Je to především statistický nástroj, pomocí kterého lze provádět předpovědi. Jde o odvozování chování, aniž by existovala předem stanovená pravidla. Generuje zprávy mimo jiné ve formě tabulek a grafů, které podporují aktivní rozhodování. Funguje na základě informací, které již byly plně zpracovány.
Rozdíl mezi OLAP a Data Mining
Jakmile jsou zváženy hlavní aspekty OLAP a Data Minig, lze mezi nimi stanovit základní rozdíl.
- Pomocí OLAP je interpretována současná situace společnosti a poskytuje rychlé odpovědi, které usnadňují rozhodování.
- Data Minig předpovídá situace na základě studia skrytých znalostí, které vyvolávají určité typy chování.
V důsledku toho se oba systémy zabývají řešením různých typů analytických situací.
Data Minig a jeho vztah s Data Warehouse
Systém Data Minig je technologie podpory pro koncového uživatele, jejímž cílem je získat užitečné informace z informací obsažených v databázi společností. Jinými slovy, původ informací použitých algoritmy Data Minig jsou obvykle historická data obsažená v Data Warehouse.
Musí existovat integrace mezi technikami Data Minig a procesy zahrnutými v Data Warehouse. To znamená, že aby bylo možné provádět obchodní analýzu, musí existovat dohoda mezi Data Minig, Data Warehouse a serverem OLAP.
Pokaždé, když Data Warehouse poskytne nové výsledky, může společnost znovu použít Data Minig pro optimalizaci rozhodování.
Stručně řečeno, Data Minig a Data Warehouse jsou plně kompatibilní nástroje. Data Warehouse poskytuje paměť a inteligenci Data Minig.
Tradiční databáze vs Data Warehouse
Analýza dosud odhalených aspektů nás vede k pochopení, že datový sklad se liší od databází, které podporují každodenní transakce organizací. Zde jsou základní rozdíly
- V tradičních databázích jsou informace uspořádány tak, aby je bylo možné snadno načíst a aktualizovat. Datový sklad je organizovaný a orientovaný na koncového uživatele, který může pouze zadávat dotazy.
- Transakční databáze se starají o každodenní zpracování dat. Datový sklad pracuje s historickými daty, tj. Odpovídajícími dlouhým časovým obdobím.
- Tradiční databáze jsou přístupné několikrát během pracovního dne. V datovém skladu jsou hodnoty a dotazy minimální, protože se k nim přistupuje sporadicky.
- Objem dat, které Data Warehouse spravuje, je mnohem větší než objem spravovaný v tradičních databázích.
- Struktura transakčních základen je stabilní. Struktura datového skladu se liší podle jeho vlastního vývoje a použití.
Dále nějaké založíme Příklady datového skladu.
Příklady datového skladu
Národní společnost zabývající se prodejem čisticích potřeb pro velkoobchod a maloobchod, považovaná kromě střední velikosti za svůj objem prodeje, má hlavní cíl maximalizace zisku. Podobně chcete získat více zákazníků, chcete expandovat na novou úroveň trhu a později rozšířit svou produktovou řadu. Jednou z jejích hlavních zásad je neustálé zlepšování s cílem získat lepší pozici vůči svým konkurentům ve vzorcích datového skladu.
Aplikace datového skladu nabízí organizaci následující výhody.
- Umožňuje uživatelům mít přehled o podnikání.
- Transformujte provozní data na analytické informace zaměřené na rozhodování.
- Generujte dynamické zprávy, které usnadňují vaši analýzu.
- Usnadňuje tvorbu strategií pro plnění cílů organizace.
- Prospívá to stabilitě firemní struktury.
Další příklad denního datového skladu se týká řízení vzdělávací instituce, která má nedostatky v komunikaci se svými studenty. Podobně chybí jednotné informační centrum, které by mělo všechny jejich informace. Cílem instituce je doprovázet studenty během jejich kariéry a po ukončení studia, nabízet nové návrhy, které zlepší výkon organizace a rozvoj studentů.
Aplikací datového skladu se snažíme reagovat na potřeby univerzity. V zásadě je odstraněno zdvojování informací a přítomnost chybných podrobností o studentech, jakož i všech informací, které jsou obecně považovány za nekvalitní a které nejsou relevantní. Kromě toho jsou všechny informace integrovány a tvoří jednotný záznam studentů, který slouží jako základ pro správný vývoj projektu instituce.
Nakonec jsou podporovány marketingové aktivity, které univerzitě přinášejí větší užitek a pomáhají jejímu růstu správným řízením informací.
Na závěr v příkladech datového skladu nabízí možnost vědět, co se v organizaci děje, co se stalo, co se může stát a proč. Můžete vidět článek typy počítačových virů.



