LDoms: Verbesserte vDisk Performance

Bei der Leistung von virtuellem IO sollte man seine Erwartungen in realistischen Grenzen halten.  Darauf habe ich in all den Jahren in allen LDom Workshops hingewiesen.  Und ich werde jetzt nicht damit aufhoeren.  Virtuelles IO ist immer mit gewissen Kosten verbunden, einfach deswegen, weil es einen gewissen Aufwand bedeutet, die physischen IOs in virtuelle IOs zu uebersetzen.  Und bis zur Entdeckung der Zeitreise wird dafuer immer auch ein wenig Zeit gebraucht werden.  Soweit, so schlecht.  Es gibt aber auch gute Nachrichten:

Erstens ist der Overhead virtuellen IOs in vielen Faellen tatsaechlich kleiner als befuerchtet - die LDom Implementierung ist sehr effizient.  Und in vielen dieser vielen Faellen schaded dieser Overhead nicht.  Meist, weil es der Anwendung egal ist, bzw. das virtuelle IO schnell genug.

Zweitens gibt es natuerlich gute und weniger gute Arten, virtuelles IO zu konfigurieren.  Wenn man sich an die guten haelt (wie ich sie bspw. hier besprochen habe), kann man die Anzahl der Faelle, in denen virtuelles IO einfach gut genug ist, noch ein gutes Stueck erhoehen.

Aber es gibt natuerlich auch die Faelle, in denen es einfach nicht reicht.  Gluecklicherweise gibt es noch weitere gute Nachrichten:

Die Leistung des virtuellen Netzwerks wurde mit einer neuen Implementierung erheblich verbessert.  Durch den Einsatz von Large Segment Offload (LSO) und einiger anderer Techniken wurde der Durchsatz gesteigert und die Latenz reduziert - bis an einen Punkt, an dem die Leistung des virtuellen Netzwerks als Grund fuer Performanceprobleme weitgehend entfallen ist.  Das war in LDoms 3.1.  Jetzt ist virtuelles Disk-IO an der Reihe, mit ganz aehnlichen Verbesserungen.

Beim Thema Disk IO und Performance gibt es eine grundlegende Empfehlung:  Die IO-Last auf moeglichst viele LUNs verteilen.  Das war bereits so, lange bevor man auch nur an Virtualisierung gedacht hat.  Der Grund dafuer ist einfach die begrenzte Anzahl an IOPS, die eine einzelne LUN liefern kann.  Dabei ist es egal, ob es sich bei dieser LUN um eine einzelne physische Platte oder ein Volume eines groesseren Disk Arrays handelt.  IOPS einer einzelnen LUN sind begrenzt und IOs fuer diese LUN werden in einer sehr sequentiellen Warteschlange auf diese LUN warten.  Eine einzelne Platte liefert seit Jahren ca. 150 IOPS.  Oder auch 300.  Eine SAN LUN mit einem starken Array im Hintergrund liefert vielleicht 5000 IOPS oder ein paar mehr.  Aber das reicht nicht, heute so wenig wie gestern.  Deswegen hat man RAID 1 erfunden.  Und die Virtualisierung von Servern und Storage aendern nichts an dieser Situation.  Fuer LDoms bedeutet das nun einfach, mehrere LUNs, also mehrere vDisks pro Gast zu konfigurieren. In vielen Faellen ist das ausreichend, um gute IO Performance zu bekommen.  Leider gab es jedoch zu viele Faelle in denen das eben nicht gut genug war und man letzten Endes zurueck zu physischem IO musste.  Nun gibt es natuerlich diverse Moeglichkeiten, physisches IO und Server-Virtualisierung mit LDoms zu verbinden.  Aber befriedigend war die Situation nicht.

Mit der Freigabe von Solaris 11.1 SRU 19 (und einem entsprechenden Patch fuer Solaris 10 wenig spaeter) wird nun auch fuer den vds/vdisk Software Stack eine neue Implementierung eingefuehrt, die diese Situation grundlegend aendert.  Durchsatz und Latenz von virtuellem Disk-IO werden wesentlich verbessert, wie man an den folgenden Diagrammen ablesen kann.

Dieses erste Diagramm zeigt IOPS im Vergleich von Bare Metal mit virtuellem Disk-IO, sowohl mit der alten als auch mit der neuen Implementierung.  Wie man leicht erkennen kann gibt es erhebliche Verbesserungen, die neue Implementierung unterscheidet sich nur marginal von Bare Metal.  Die Unterschiede sind so gering, dass es sich auch um statistische Ungenauigkeiten bzw. normale Schwankungen zwischen zwei Messungen handeln koennte.  Zu beachten ist, dass die hier gezeigten Messwerte mit 28 SAN LUNs erzielt wurden.  Erwartungen, eine einzelne LUN wuerde nun ploetzlich 150k IOPS liefern, muss ich leider enttaeuschen.  Die Verbesserung gegenueber der alten Implementierung sind mit bis zu 55% erheblich.  Wichtig zu beachten ist allerdings, dass man mit nur einem IO Strom (den "Threads" im Diagram) und einer einzelnen LUN weniger offensichtliche Verbesserungen beobachten wird.  Das liegt daran, dass wesentliche Teile der neuen Implementierung sich auf die De-Serialisierung der IO-Infrastruktur konzentrieren, was man natuerlich nicht bemerken wird, wenn man nur einen einzelnen, seriellen IO-Strom misst.  Im wirklichen Leben sind die grossen, IO-hungrigen Anwendungen jedoch meist parallel unterwegs.  Auch wenn das eigene Storage-Backend mit den parallelen Anfragen ueberfordert ist (z.B. weil man aus Versehen auf der einen, internen Platte testet) wird man wenig Veraenderung feststellen.

Durchsatz ist somit kein Problem mehr (mit 150k IOPS und 1.1 GB/sec virtuellem IO in diesem Test meine ich das behaupten zu duerfen).  Aber wie sieht es mit der Latenz aus?  Dazu das naechste Diagramm:

Auch hier sieht man wieder, dass sich die Latenz der neuen Implementierung kaum von Bare Metal unterscheidet.  Der groesste Unterschied sind 4% im Fall von 2 parallelen Threads.   Das ist wenig genug um ueber den Begriff "Zero Overhead" nachzudenken, zumindest in Bezug auf IO Leistung.  Wo wir gerade von Overhead reden:  Ich nennen den Overhead, der durch Virtualisierung entsteht gerne auch "Virtualisierungssteuer" - die Ressourcen die man in die Virtualisierung selbst investiert, oder aber die Performance die durch oder wegen der Virtualisierung verloren geht.  Im Falle von LDoms Disk IO haben wir damit soeben eine erhebliche Steuersenkung erfahren:

Dieses letzte Diagramm zeigt um wie viel hoeher die Antwortzeit mit der alten Implementierung war und wie viel davon wir mit dieser beeindruckenden Programmierleistung  der neuen Implementierung zurueck bekommen.  Vorher musste man bis zu 55% Virtualisierungssteuer fuer virtuelles Disk-IO bezahlen, jetzt sind es 4% oder weniger.  Ein grosses "Danke Schoen!" an Engineering!

Natuerlich darf an dieser Stelle ein Haftungsausschluss nicht fehlen:  Ihre eigenen Ergebnisse werden sich von diesen Testergebnissen unterscheiden.  Die hier gezeigten Resultate wurden mit 28 LUNs aus einer irgendwie gearteten FC Infrastruktur gemessen.  Die Tests wurden mit vdbench in einer Mischung aus 60% lesendem und 40% schreibendem Random-IO gemacht, mit zwischen 2 und 20 parallelen Threads.  Das ist eine IO-Last, die jedes IO-System stark beansprucht und gleichzeitig das IO-Muster, bei dem die hoechste Virtualisierungssteuer beobachtet wurde.  Dennoch muss klar sein, dass sich die Ergebnisse von denen in anderen Tests oder tatsaechlichen Produktionsumgebungen unterscheiden werden und evtl. nicht die gleichen Verbesserungen erreicht werden koennen.  Auch wenn ich sehr optimistisch bin, dass sie sehr aehnlich sein werden.

Abschliessend kann man sagen, dass mit den neuen, wesentlich verbesserten Implementierungen fuer virtuelle Netzwerke und jetzt auch virtuelle Platten die Bandbreite der Anwendungen, die sich problemlos auf virtuellem IO betreiben lassen erheblich vergroessert hat.  Was den Erwartungen der Kunden entspricht, die ich in meinen Workshops treffe:  High End Performance ist eine Selbstverstaendlichkeit fuer SPARC Systeme, virtualisiert oder nicht.

Kurz vor Schluss: Was muss man eigentlich tun um in den Genuss dieser Verbesserung zu kommen?
  • Bei Solaris 11 muss der Update auf Solaris 11.1 SRU 19 in
    • Allen Gast Domains die die neue Implementierung nutzen wollen, und
    • Allen IO Domains die die Infrastruktur hierfuer bereit stellen, eingespielt werden.
    • Darin enthalten ist natuerlich auch der Update auf LDoms Manager 3.1.1
    • Es muessen beide Partner, Gast und IO-Domain aktualisiert werden, ansonsten wird die alte Implementierung weiter verwendet.
  • Einen Patch fuer Solaris 10 wird es in Kuerze natuerlich auch geben.

Update 2014-06-16: Patch 150400-13 fuer Solaris 10 ist nun verfuegbar.  Im Readme stehen die Details.

Kommentare:

Senden Sie einen Kommentar:
Kommentare sind ausgeschaltet.
About

Neuigkeiten, Tipps und Wissenswertes rund um SPARC, CMT, Performance und ihre Analyse sowie Erfahrungen mit Solaris auf dem Server und dem Laptop.

This is a bilingual blog (most of the time). Please select your prefered language:
.
The views expressed on this blog are my own and do not necessarily reflect the views of Oracle.

Search

Categories
Archives
« Mai 2015
MoDiMiDoFrSaSo
    
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
       
Heute