Sonntag, Oktober 20, 2013

SSAS: Sortierung und Compression

Wobei ich neidlos anerkenne, dass der Titel, den Danny Lee seinem Artikel, auf den ich mich hier beziehe, gegeben hat, deutlich hübscher ist: Analysis Services Multidimensional: It is the Order of Things (was sich übrigens nicht auf Michel Foucaults berühmtes Buch, sondern auf einen Dialog von Commander Sisko mit einem Jem'Hadar-Krieger bezieht, was nicht verwundert, denn wir sind hier ja nicht mehr in Kansas...).

Worum es dabei geht? Um den Zusammenhang zwischen Sortierung der relationalen Basisdaten und Größe des erzeugten Cubes (und insbesondere der MeasureGroups) - oder anders ausgedrückt: um den Einfluss der Sortierung auf die Komprimierbarkeit der Daten. In einem vorgestellten Beispiel reduziert die Sortierung die Cube-Größe dabei um 43% (was zu meinen eigenen - internen - Notizen passt, die ich gerade noch mal nachgeschlagen habe). Dabei gilt grundsätzlich, dass die compression um so stärker ausfällt, je kleiner der Range von DataIds ist, die für ein Segment berücksichtigt werden müssen. Neben der verbesserten Komprimierung erlaubt die Sortierung dabei auch eine effektivere Segment Elimination bei der Filterung nach Attributen. Da die Ordnung nach einem Attribut in der Regel zu einer größeren Unordnung für andere Attribute führt, gilt für Fakten, dass man bei ihrer Sortierung mit den Attributen beginnen sollte, die sich am häufigsten wiederholen - im Beispiel des Artikels ergäbe sich die Sortierreihenfolge (Date, Time, Product, Sales).

Das sind natürlich keine ganz neuen Einsichten, sondern Informationen, die man auch in den einschlägigen Publikationen zum Thema finden kann (die im Artikel auch verlinkt sind), aber furchtbar viel Neues gibt's zum Thema (multidimensional) SSAS wohl auch nicht zu sagen, was ich immer noch bedauere.

Kommentare:

  1. vielleicht gibt's aber auch einen "Useless Use Of Star Trek References Award" - in der Tradition von http://partmaps.org/era/unix/award.html.

    AntwortenLöschen