Šta je Big Data

Sve što radimo u savremenom svetu kreira neke podatke. Sa svakom kupovinom, posetom nekom veb-sajtu, naši telefoni ili drugi elektronski uređaji ostavljaju iza sebe neke tragove, tj. podatke. Nije novina to da je osnovna snaga nekih modernih biznisa upravo u njihovoj sposobnosti da obrađuju ogromne količine podataka i na osnovu njih vrše predviđanja, donose zaključke i predlažu akcije. Izraz Big Data se koristi da se pre svega naglasi raznolikost u strukturama obrađivanih podataka a podela podataka u kategorije (u tabeli ispod) je ključna u razumevanju koliko je veliki izazov da se raspolaže svim tim podacima na neki standardizovan način da bi se osigurali rezultati. Skladištenje svih tih vrsta podataka na način da to omogućava njihovo optimalno korišćenje u momentu kada za tim bude potreba je prvi korak u eksploataciji poslovne vrednosti iz Big data koncepta.

Šta je Data Lake

Data Lake je sabirno mesto za prikupljanje i čuvanje struktuiranih i nestruktuiranih podataka. Podaci mogu da se smeštaju u svom izvornom obliku bez potrebe da se transformišu na bilo koji način. Nakon smeštanja, moguće je da se prave različite vrste upita, pretraga i obrada podataka korišćenjem alata za analitiku, obradu u realnom vremenu i algoritme mašinskog učenja. Na ovaj način, kompanije mogu da dobiju kvalitetnije informacije iz podataka koje već imaju, ali ne mogu da ih koriste u svom izvornom obliku. Sve navedeno čini Data Lake prirodnim okruženjem za Big data i osnovom bilo kakvih inicijativa banaka na polju veštačke inteligencije ili mašinskog učenja.

Data Lake ili Data WareHouse

Data Warehouse je baza optimizovana za analizu relacionih podataka koji dolaze iz transakcionih sistema i niza poslovnih aplikacija. Struktura podataka je unapred definisana i optimizovana za pretragu SQL upitima.

Data Lake je proširenje koncepta Data Warehouse-a jer pored struktuiranih skladišti i nestruktuirane podatke čiji su izvori mobilne aplikacije, IoT senzori ili društvene mreže. Oni se pretražuju na drugi način, koristeći mašinsko učenje, algoritme za pretragu teksta, Big data analitiku.

Opšte pogodnosti

Troškovna efikasnost

čuva i skladišti podatke u jednom skladištu podataka, čineći ga isplativim.

Optimizacija

Pošto se strukturisani i polu-strukturisani podaci skladište i kontrolišu u jednom spremištu, aktivnosti obrade podataka su optimizovane. Radni zadaci poput transformacije i integracije podataka vrše se relativno brže pomoću ovog rešenja.

Efikasnost

čini izdvajanje, transformisanje, učitavanje (ETL) bržim i efikasnijim

Inovacije na bazi podataka

omogućavaju analitičkim alatkama da rade u svim podacima koji ranije možda nisu bili povezani, čime se stvaraju novi uvidi za preduzeća

Ko ima korist od Data Lake-a?

Korisnici, poslovni analitičari i naučnici za podatke mogu lako da pronađu informacije koje su im potrebne bez opsežnog uključivanja IT-a

Stratezi za podatke i nadzornici podataka mogu da učine informacije dostupnim korisnicima na organizovan način kojim se dobro upravlja

Timovi za IT bezbednost i upravljanje mogu biti sigurni da se informacijama upravlja u skladu sa dobro definisanim organizacionim i regulatornim politikama

Koristimo "cookies" kako bismo unapredili funkcionalnost našeg veb sajta. Pritiskom na bilo koji link na ovoj stranici prihvatate korišćenje "cookies".