
Premišljate se oko savremenog skladišta za podatke: Stvar prošlosti ili progresivno?
Šta želimo od skladišta za podatke? Da li nam je potrebno kašnjenje upita od manje od jedne sekunde? Ponekad. Da li nam je potrebna ogromna skalabilnost sa nula degradacije performansi? Možda. Uglavnom, samo nam je potrebno neko mesto da smestimo i organizujemo informacije koje podržavaju današnju analitičku aktivnost.
Lako je biti zaslepljen (i zadivljen) brzom inovacijom i evolucijom u oblasti velikih podataka. Današnje tehnički najnaprednije kompanije imaju priliku da koriste alatke za velike podatke da bi se bavile neverovatno kul slučajevima upotrebe i da bi proizvele veoma privlačne rezultate. Međutim, mnoge danas i dalje zavise od ideala i radnog toka (da i ne spominjemo nepovratne investicije) tradicionalnog skladišta za podatke.
Nedavno istraživanje kompanije Aberdeen pokazuje da su kompanije, koje su najbolje u svojoj klasi, pronašle pravu formulu da iskoriste infrastrukturu svog skladišta za podatke, u kombinaciji sa novijim procesima i tehnologijama, kako bi podržale veći nivo analitičke aktivnost. Neke ključne karakteristike koje ove vrhunske kompanije dele obuhvataju sledeće:
- Postoji tehnologija jezera podataka. Skalabilnost i fleksibilnost u infrastrukturi podataka nisu ciljevi samo najvećih i najnaprednijih kompanija. Mada zahtevi mogu da se razlikuju, svaka kompanija koja značajno ulaže u svoje okruženje podataka ima jaku potrebu da upravlja rastom količine podataka i njihovom kompleksnošću na efikasan način. Mnoge kompanije istražuju arhitekturu jezera podataka kako bi pomogle u odgovaranju na te potrebe. Međutim, u skladu sa istraživanjem kompanije Aberdeen, samo oko jedne trećine organizacija sa trenutno implementiranim jezerom podataka je izgradilo isto pomoću tehnologije otvorenog koda na bazi Hadoop-a. Većina organizacija koristi komercijalno dostupne tehnologije (uključujući softver skladišta za podatke) kako bi ostvarila fleksibilnost i skalabilnost koje nudi jezero podataka.
- Različiti niz podataka u upotrebi. Mnogi bi istakli da je klasični razlog postojanja (raison d’être) skladišta za podatke da podržava analitičku aktivnost. Po toj definiciji, savremena arhitektura podataka stoga bi morala da smesti i organizuje veoma različite podatke. Tradicionalni strukturirani podaci na bazi aplikacija i dalje predstavljaju najveći deo informacija koje većina kompanija koristi za analizu. Međutim, organizacije se sve više trude da koriste informacije od spoljašnjih izvora trećih lica, nestrukturirane podatke sa kanala društvenih medija, ili mašinski generisane podatke Interneta stvari (IoT). Vodeće kompanije imaju efikasnija okruženja za upravljanje podacima, prevashodno usled njihove potrebe da budu u stanju da podnesu toliku različitost podataka. Ovo istraživanje pokazuje da je veća verovatnoća da bi kompanije koje su najbolje u svojoj klasi ocenile te netradicionalne tipove informacija kao „kritične“.
- Jako upravljanje podacima / nadgledanje podataka. Pored trenda različitosti podataka sa kojim se toliki broj kompanija suočava, mnoge od njih takođe zapažaju rast broja korisnika koji postaju aktivniji. I to se ne odnosi samo na analitičku aktivnost, već i na pristupanje i rukovanje podacima. Nije sporno da je ovo okruženje sa više podataka i više korisnika veoma zdravo za analitičke perspektive tipične kompanije, ali takođe zahteva uvećan nivo odgovornog nadgledanja upotrebe podataka. Veća je verovatnoća da kompanije koje su najbolje u svojoj klasi poseduju odgovarajuće politike i procedure za upravljanje pristupom podacima i njihovom pravilnom upotrebom. Međutim, takođe postoji veća verovatnoća da će ove vrhunske kompanije podržavati ove politike pomoću za to predviđene tehnologije, čime se omogućava veća automatizacija njihovog nadgledanja upotrebe podataka.
Ove karakteristike koje su najbolje u svojoj klasi pomažu kod olakšavanja neometanog toka informacija u okviru svojih organizacija, uvećane analitičke aktivnosti, kao i unapređenog poslovnog učinka. Međutim, ovo istraživanje takođe pokazuje da su ovi aspekti jako bliski i dragi kompanijama sa ličnim interesom za korišćenje tehnologije skladišta za podatke. Drugim rečima, kompanije koje posmatraju tehnologiju skladišta za podatke kao nešto od ključnog značaja, takođe prepoznaju aktivnosti koje su ključne za njenu uspešnost (Slika 1).
Prevod slike:
DW – visok prioritet ulaganja DW – nizak prioritet ulaganja
- Jezero podataka je trenutno implementirano ili se planira
- Jako upravljanje podacima, koje podržava tehnologija
- Mašinski generisani IoT podaci ocenjeni kao „kritični“ ili „važni“
% ispitanika n = 342, Izvor: Aberdeen Group, april 2017.
Slika 1: Karakterizacija savremenog skladišta za podatke
Kao što je pomenuto, koncept jezera podataka nije neraskidivo povezan sa Hadoop tehnologijom otvorenog koda. Veći broj kompanija i dalje namerava da iskoristi prethodno ulaganje u komercijalno dostupnu tehnologiju skladišta za podatke (i povezane nizove veština) kako bi izgradio svoje jezero podataka. Upravljanje i nadgledanje podataka važni su za one koji stalno ulažu u skladište podataka, a isto važi i za različitost podataka. Zapravo, pored značaja IoT podataka koji su prikazani na Slici 1, ove organizacije su takođe ocenile nekoliko drugih tipova podataka (npr. geoprostornih informacija na bazi lokacije, nestrukturiranih podataka), kao kritične ili veoma važne za njihove analize.
Zaključak
Mnogi su se naglas zapitali da li je koncept skladišta za podatke prevaziđen. To nije nerazumno pitanje, imajući u vidu negativnu percepciju koju često nose projekti skladišta za podatke. Ti projekti se ponekad smatraju (ili doživljavaju) kao gubljenje vremena i bacanje novca. Međutim, mnoge uspešne implementacije skladišta za podatke se svakako mogu adaptirati tako da prežive i uspevaju u današnjim često izazovnim okruženjima velike količine i kompleksnosti podataka. Kompanije koje su najbolje u svojoj klasi ujedinjuju tehnologiju skladišta podataka sa drugim upotpunjujućim alatkama i platformama, kao i odgovarajućim procesima i politikama, kako bi proizvele stvarne rezultate iz svojih podataka.
Za dodatne, povezane informacije, obavezno istražite ovaj izveštaj.