La o simplă căutare pe Google, veţi găsi peste 200 de milioane de rezultate pentru Big Data - supra-abundenţa datelor. De vreo cinci ori mai multe decât atunci când aţi căuta „computer virus”. Se poate spune că „virusul” Big Data este mai interesant decât virusul calculatoarelor.
Încă de la început, ne menţinem o oarecare rezervă asupra acestei nevoi. Este una reală sau se vrea a ne fi indusă? Se doreşte crearea unui comportament anume faţă de date? Se intenţionează a se demonstra neputinţa organizaţiilor în faţa bombardamentului informaţional la care sunt supuse? Se pare că da, întrucât, de cele mai multe ori, astfel de mesaje sunt evidente. Datele nu mai pot fi stăpânite; datele sunt prea multe în comparaţie cu cele stocate în actualele sisteme de gestiune a bazelor de date; analiza datelor trebuie efectuată cu pachete statistice de pe calculatoare tot mai performante, necesitând o execuţie cu soft paralel pe zeci, sute sau mii de servere.
Într-un astfel de cadru, vom aborda patru probleme:
1. Big Data, o nouă modă sau o nouă industrie?
Big Data nu trebuie privit doar sub accepţiune cantitativă ci, mai ales, ca importanţă, pentru că putem să-l vedem ca un îndemn la “scormonirea” multor munţi de date, determinând, şi în acest caz, comportamente iraţionale: achiziţia de date “doar cu buletinul”. Asta, pentru că fiecare producător de “ceva” legat de date creează nevoia de acel ceva. Astfel, se ajunge la curentul de apartenenţă la reţele sau, cu alte cuvinte, la vechiul efect de fax, conform căruia un fax singur, necuplat cu altele, nu are valoare.
Deja, prin acest curent, asistăm la cea mai rapidă schimbare a unităţilor de măsură a cantităţii de informaţie: de la gigabyte (109) - terabyte (1012) - petabyte (1015) - exabyte (1018) - zettabyte (1021), yottabyte (1024), xennabyte (brontobyte) (1027), vekabyte (1030). Până la Googol (10100) sau Googolplex (10Googol) pare a fi o cale lungă. Cine o poate aproxima?
La cantitatea imensă de informaţie, se anunţă o nouă industrie, cea a datelor. Putem vorbi deja despre economia centrată pe date, printr-o revoluţie industrială a datelor, economia datelor din diferite domenii de activitate şi economia Internet.
2. Big Resources pentru Ciclul de viaţă Big Data
În orice industrie vorbim de ciclul de viaţă. Ciclul de viaţă Big Data presupune, însă, altfel de resurse umane, echipamente şi soft pe etape: culegere, prelucrare, utilizare, distribuţie, stocare, analize. Mai mult, trebuie respectate noi principii ale erei Big Data: intimitate, securitate, stocare (nu mai mult timp decât e necesar), prelucrare, proprietate, integritate. Nu trebuie să uităm că ne aflăm şi sub influenţa Cloud Computing (prelucrarea unor volume mari de date cu resurse disponibile pe Internet).
Pentru a ne raporta la importanţa ciclului de viaţă Big Data, precizăm doar că, pentru 2010, informaţia prognozată a fi creată este de 1750 Exabytes, iar cea a fi stocată de ~800 Exabytes, deci o pierdere imensă. În aceste condiţii, prezintă mare interes să se răspundă la o serie de întrebări: De ce se produce?; Cine o produce?; Cu ce eforturi?; Cu ce consum de energie?; Cu ce emisii de CO2?; Ce se pierde?; Cine pierde?; Cine plăteşte?
3. Bulimia Big Data
Goana după cât mai multă informaţie, sub orice formă, cu orice cost, poate „produce” o foame nesăţioasă de date, de unde şi tentaţia unei producţii scăpată controlului, dar provocată. Internetul este cea mai sigură cale de creare a comportamentului Pro Big Data, folosit pentru colectarea, stocarea, prelucrarea datelor. Iar pentru toate acestea se pot lua cu chirie, pe perioade foarte scurte de timp, capacităţi de prelucrare de la Google, Microsoft, Amazon ş.a.
Este poate mai actuală decât oricând deviza sfârşitului de secol XX: Cine stăpâneşte informaţia lumii, va stăpâni lumea! Şi atunci nu este de mirare că ni se induc comportamente iraţionale în faţa datelor la fel ca şi în cazul oricărui alt produs de pe piaţă.
4. Norii negri ai externalizării Big Data
Pentru a face faţă Big Data, se va crea un sistem planetar de prelucrare distribuită a datelor, constituind o nouă formă a globalizării. Acesteia, în timp, i se va replica prin deglobalizare sau reglobalizare, în care cuvântul cheie va fi localul. Se vor lua măsuri de precauţie, astfel încât setul de resurse locale/regionale/naţionale să fie utilizabile în variantă redusă a cloud computing.
Efectul îl va constitui dependenţa tot mai mare de resursele altora iar, de aici, dependenţa de tarifele lor. În aceste condiţii, se vor multiplica înmiit ofertanţii de servicii şi produse specifice noului mediu, în orice colţ al planetei. Însă, deja s-a realizat o externalizare inversă, ca şi inovarea inversă: “bogaţii” din ţările cu tradiţie IT sunt angajaţii noilor companii, chiar din ţările emergente.
Prin folosirea numai în anumite momente a resurselor informatice, costurile cu Big Data vor fi tot mai reduse. Dar, protejarea datelor va deveni o adevărată provocare.
Nu trebuie să mai demonstrăm, din cele expuse, că orice comportament este indus, ceea ce explică şi spusele lui Steve Jobs: „Niciodată nu întreb oamenii ce vor, ci îi fac să-şi dorească ce le ofer”. Ca urmare, faceţi un pas să deveniţi unul dintre ofertanţii noilor servicii pentru era Big Data. Iar dacă apelaţi la astfel de servicii, aveţi grijă pe mâna cui lăsaţi datele.