Agregare si sumarizare

Aplicatiile tranzactionale utilizează datele doar la nivel de detaliu, astfel încît de regulă datele furnizate de către sistemul operational către depozitul de date sînt date de detaliu. În schimb, analiza economică este foarte adesea interesată de imagini globale asupra unumitor aspecte ale activitătii modelate. Un manager din conducerea superioară a unei companii nu este interesată de vînzările zilnice ale produsului x la magazinul y, ci mai degrabă de dinamica lunară sau trimestrială a vînzărilor unei anumite familii de produse într-o anumită zonă geografică.

Cu toate că orice instrument OLAP poate realiza dinamic toate calculele necesare, aceasta necesită timp si resurse computationale, astfel încît pentru acele seturi de date care sînt în mod frecvent cerute într-o astfel de formă, se preferă pre-calcularea unor valori globale. Această operatie este numită fie consolidare (mai ales atunci cînd se referă la aspectul conceptual), fie sumarizare (mai ales din perspectivă procedurală), fie agregare (atunci cînd este vizat mai ales aspectul structural). Termenii pot fi însă considerati sinonimi, în absenta unor precizări explicite.

Întotdeauna aceste agregări se referă la o anumită metrică si se fac după dimensiunile corespunzătoare acesteia. Pentru atributele organizate ierarhic, consolidarea se nivel cu nivel (procedeu numit roll-up). De cele mai multe ori sumarizarea implică doar calcularea unor totaluri, dar există situatii în care se cer aplicate formule mai complicate sau anumite procedee statistice.

Sumarizarea este foarte utilă si atunci cînd se pune problema înlăturării din zona activă a depozitul de date a unor informatii vechi, care sînt accesate foarte rar. Arhivarea datelor de detaliu este precedată de o sumarizare. Nivelul la care se face sumarizare în cazul în care sînt implicate ierarhii de atribute se numeste granularitate.

Indiferent de granularitatea sumarizării, instrumentele OLAP trebuie să permită navigarea pe nivele diferite de sumarizare. Această tehnică analitică se numeste drill up sau drill down, în functie de directie (up - spre datele cele mai agregate, down - spre datele cele mai detaliate).

Agregarea crează la rîndul ei redundantă, dar volumul acesteia nu este semnificativ deoarece scade exponential cu fiecare nivel de sumarizare. Cîstigul de performantă obtinut la acesarea datelor poate fi însă dramatic.


(C) Copyright Computer Press Agora