hétfő ápr. 23, 2012

Az Exadata Hybrid Columnar Compression tömörítés előnyeiről

Az Oracle Exadata Database Machine adatbázisgép adatbázisain használhatjuk a nagy hatékonyságú és extrém nagy arányú tömörítési eljárások csoportját, amik neve Exadata Hybrid Columnar Compression (EHCC). Az EHCC tömörítés az Exadata környezetben ingyenes! Miért "Hibrid" a  Hibrid Oszlopos tömörítés? Azért Hibrid a tömörítés jelzője, mert az adatbázis táblákat a sorok mentén tömörítési egységekre bontja, és ezekben külön tömöríti az oszlopokat. Leírás:  Hybrid Columnar Compression (HCC) on Exadata.

Az Exadatán az adattárházak esetében alapértelmezésben használjuk az EHCC-t! Ezt sok száz Exadatán működő adattárház validálja, "de facto szabványként" használják az Exadata ügyfelek, és elégedettek vele. Az EHCC kezelésében az intelligens Exadata storage szoftver nagymértékben közreműködik, az offload esetben ez kis teljesítmény igényt jelent az adatbázis szerverekre. Nézzünk néhány példát Exadatán futó adattárházak esetében a Hybrid Columnar Compression alkalmazására:

Exadata Reference Booklet ügyfél sikersztorikkal.

Lehet gyorsabb az EHCC-vel tömörített adatok lekérdezése az Exadatán a tömörítetlen adatok lekérdezésénél! IGEN, az Exadatán az EHCC tömörítéssel kis helyen tárolt adatok lekérdezésekor jóval kevesebb adatot kell megmozgatni, mert a tömörítés hatása miatt kevesebb IO művelete kell a kevesebb adathoz és a Smart Scan hatása is érvényesül.

Az Exadatán futtatott adattárház (DW) adatbázisokban tipikus teljesítményjavító és további helytakarékossághoz vezető módszer az indexek elhagyása is. Célszerű adattárházban az összes indexet kikapcsolni, majd egyenként visszakapcsolni a valóban szükségeseket. Ennek több oka is van:

  • az indexeket a database szerverek kezelik
  • az indexek karbantartásával kapcsolatos munkát megspóroljuk
  • az indexek által elfogalt helyet is megspórolhatjuk
  • az Exadata Smart Scan és az Exadata Storage Indexek extra gyors szűrést tesznek lehetővé
  • így az intelligens Exadata Storage Serverekre még több munkát offloadolhatunk

Mikor indokolt az EHCC hibrid oszlopos tömörítés alkalmazása:

  • adattárházak (data warehouse) esetében mindenképpen!
  • OLTP azaz tranzakciós jellegű adatbázisok esetében szintén előnyös, főleg a régebbi adatok partícióinak tömörítésére, OLTP esetben alkalmazhatjuk az Advanced Compression tömörítéssel egymás kiegészítésére,
  • adatbázis konszolidáció esetében, több adatbázinál is jelentős helymegtakarítás érhető el.

Milyen fő HCC tömörítési eljárásokat használhatunk, sorrendben a növekvő tömörítési arányok szerint:

  • QUERY LOW, jó tömörítés (jobb az Advanced Compression-nél), minimális teljesítményigény
  • QUERY HIGH, a legtöbbször használt algoritmus, kiváló tömörítés, kicsi teljesítményigény
  • ARCHIVE LOW, nagy tömörítés
  • ARCHIVE HIGH: a legnagyobb tömörítési arány, archív adatok az adatbázisban, folyamatosan elérhetőek

Hogyan nézhetjük meg, hogy mekkora tömörítést érhetnénk el az Exadatán?

Az Oracle 11gR2 adatbázisban bárki számára elérhető Compression Advisor eszközzel megmérhetjük a HCC és az Advanced Compression tömörítési algoritmusok tömörítési arányát. Leírás:  Hybrid Columnar Compression (HCC) on Exadata. Csak egy e-mail-be kerül, és segítek!

About


Fekete Zoltán vagyok, 1998 óta dolgozom az Oracle presalesben. Az Oracle üzleti intelligencia, OLAP, adatbányászat, területekkel foglalkozom. Az Oracle Exadata Database Machine területtel kiemelten foglalkozom. A blogon publikáltak saját véleményemet tükrözik, nem feltétlenül egyeznek meg az Oracle álláspontjával. The views expressed on this blog are my own and do not necessarily reflect the views of Oracle.

Search

Categories
Archives
« április 2014
HKSzeCsPSzoV
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
    
       
Today