Feeds:
Posts
Comments

Posts Tagged ‘performance study’

VMware vSphere Fault Tolerance levert de hoogste beschikbaarheid binnen de VMware architectuur. Tenminste, voor wat betreft onverwacht optredende hardware fouten. Software en data wordt namelijk perfect en synchroon gerepliceerd van de productie-omgeving naar de failover omgeving. Elke fout in de software of de data wordt dus ook perfect gerepliceerd, waardoor een failover is dat geval meestal weinig zal helpen…

VMware vSphere 6 FT

Desalniettemin zijn er genoeg toepassingen voor vSphere FT. De technologie brengt begrijpelijk wel behoorlijk wat overhead met zich mee voor de onderliggende CPU, storage en netwerkverbindingen. Daarom is het nuttig dat VMware een performance rapport heeft gepubliceerd voor vSphere 6 FT. In totaal werden 7 verschillende workloads getest, waaronder CPU- en netwerk-intensieve. De overhead blijkt eigenlijk in het algemeen nog best mee te vallen, ik had erger verwacht.

Een noemenswaardige uitzondering vormt de ontvangst van veel data via het netwerk. Deze data moet namelijk synchroon via het netwerk naar de failover machine gerepliceerd. Dat zijn dus de workloads waar je wel moet afvragen of FT de meest geschikte manier is om de beschikbaarheid te verhogen. Datzelfde geldt overigens ook voor real-time toepassingen die hoge eisen stellen aan de netwerk latency.

Het performance rapport is hier als PDF van 21 pagina’s te download.

Read Full Post »

VMware heeft de performance van een Hadoop benchmark eerst gemeten op 32 servers zonder virtualisatie, en vervolgens met virtualisatie. Het is daarbij voor de hand liggend dat virtualisatie een zekere overhead met zich meebrengt en de performance dus omlaag brengt. Echter, bij een juiste fine-tuning van het aantal virtuele servers per host blijkt de overhead volledig geëlimineerd te kunnen worden.

Hadoop performance

Deze fine-tuning is overigens wel sterk Hadoop-afhankelijk en zal voor andere toepassingen weer op een andere manier moeten gebeuren. Interessant is het echter wel. De onderliggende boodschap is dan ook dat je je over de overhead van virtualisatie in het algemeen niet al te veel zorgen hoeft te maken. Zelfs niet als het een toepassing betreft waar performance als eerste prioriteit genoemd wordt.

De white paper van VMware is hier als PDF van 20 pagina’s te downloaden.

Read Full Post »

Frank Anderson van Citrix heeft gemeten hoeveel gebruikers een VDI-server aankan, met enerzijds Microsoft Office 2010 en anderzijds Office 2013. De VDI-server draaide op versie 5.2 van de VDI-in-a-Box oplossing van Citrix met onderliggend Windows Server 2012 en Hyper-V.

Office 2010 versus Office 2013

De conclusies zijn zeker de moeite waard en zijn ook te veralgemeniseren naar andere applicaties die – net als Office 2013 – gebruik maken van DirectX10:

My testing showed a significant performance difference between Microsoft Office 2010 and 2013 applications. The results here don’t particularly reflect the Citrix software used in the test rig, but instead represent the performance impact customers may experience in VDI environments with the Microsoft Office 2013 application stack. When applications that use DirectX10 (like Microsoft Office 2013) don’t detect a GPU, then they resort to using a software rasterizer, which consumes additional CPU cycles. Since there was no GPU installed in the test rig, Microsoft Office 2013 applications consumed more CPU compared to its 2010 counterparts. When designing VDI and SBC solutions that deliver DirectX10 applications, solution architects will need to take the appropriate CPU requirements of specific workloads into account.

Bron: Frank Anderson

Read Full Post »

VMware heeft een Performance Study gepubliceerd waarin de verschillende CPU-allokatie mogelijkheden van vSphere 5.1 worden besproken. Tevens wordt het effect ervan gemeten.

vSphere COU allocation

De conclusie van het document:

The ESXi CPU scheduler achieves fair distribution of compute resources among many virtual machines without compromising system throughput and responsiveness. Relaxed co-scheduling is a salient  eature that enables both correct and efficient execution of guest  instructions with low overhead. The ESXi CPU scheduler is highly scalable and supports very big systems and wide virtual machine.

vSphere 5.1 optimizes the load-balancing algorithm introduced in 5.0. It results in noticeable reductions in CPU scheduling overhead. A policy change on hyper-threaded systems enables out-of-the-box performance of 5.1 exceeding that of a tuned version of vSphere 4.1. No special tuning is required to achieve the best performance for most common application workloads. The irtual NUMA feature introduced in 5.0 can significantly improve performance of workloads that are optimized for a NUMA environment. With vNUMA, virtual machines of any size can display optimal performance on a NUMA system. The vNUMA feature is shown to significantly improve the performance of SPEC OMP workloads. Such improvement closes the performance gap between the virtual and the native environment for high-performance-computing (HPC) workloads.

 

Het rapport van 26 pagina’s is hier als PDF te downloaden.

Read Full Post »

Mark Achtemichuk van VMware heeft de performance verschillen tussen VMware’s Raw Device Mapping (RDM) en VMDK gemeten, deze keer op basis van vSphere 5.1.

VMDK vs RDM

Zijn conclusies zijn duidelijk:

What you should takeaway from this vSphere 5.1 data, as well as all previously published data, is that there is really no performance difference between VMDK and RDM and this holds true for all versions of our platform.  +/- 1% is insignificant in today’s infrastructure and can often be attributed to noise.  The decision between VMDK and RDM is now one of architecture or functional requirement and without a special need, VMDK should be used by default.  It provides all the performance and flexibility you require to virtualize your most critical business applications.

Zie VMware vSphere Blog

Read Full Post »

Live Migration van virtuele machines van de ene CPU naar een andere stelt noodzakelijkerwijs eisen. Namelijk dat de instructie-set van de eerste CPU minstens aanwezig moet zijn bij die van de tweede. In het verleden deden hierover nog wel eens wat misverstanden de ronde.

VMware ondersteunt al heel lang een methode om die eisen te helpen invullen, zelfs als de CPU’s onderling van elkaar verschillen. Die methode wordt Enhanced vMotion Compatibility genoemd (EVC) en komt er kortweg op neer dat instructies die niet op alle CPU’s binnen een cluster aanwezig zijn (als gevolg van generatieverschillen) weg-gemaskeerd worden voor de bovenliggende virtuele machines.

De prijs die je voor EVC betaalt is die van het kleinst gemene veelvoud: je doet alsof alle CPU’s gelijk zijn aan de CPU met de minst geavanceerde instructie-set. Met andere woorden, je gooit een deel van je performance weg om compatible te blijven binnen een cluster.

VMware EVC Performance

VMware heeft de hoogte van die prijs nu wat beter bepaald door vier benchmarks te onderzoeken binnen vier verschillende CPU-generaties van Intel. De vier benchmarks zijn:

  1. Database – Oracle SwingBench
  2. Java – SPECjbb2005
  3. Encryptie – OpenSSL
  4. Multimedia – H264 video encoding

Conclusie: voor gangbare applicaties (met name database en Java) is de prijs zo goed als nul, voor multimedia kan het je wel eens zo’n 10% kosten en voor encryptie kan de prijs heel hoog zijn (met name bij Westmere CPU’s, zie ook figuur).

De volledige studie is hier als PDF document van 12 pagina’s te downloaden.

Read Full Post »

VMware heeft – samen met moederbedrijf EMC – een onderzoek uitgevoerd naar de performance van Oracle RAC. Daarbij is een fysieke omgeving vergeleken met een virtuele.

Oracle RAC on VMware

Conclusie: je levert ongeveer 7% aan performance in als je Oracle RAC virtualiseert.

Daar staat natuurlijk wel een schat aan voordelen tegenover. En als je de groei van serverkracht in ogenschouw neemt (Moore’s law: elke 18 maanden ongeveer een verdubbeling van de performance) dan komt 7% waarschijnlijk overeen met het verschil tussen het kopen van een server vandaag of over pak’m beet één of twee maanden. Niet iets om je echt druk over te maken dus.

Het rapport van 7 pagina’s is hier als PDF te downloaden.

Read Full Post »

VMware heeft een performance evaluatie gepubliceerd waarbij een moderne VoIP gebaseerde telefooncentrale (Voice-over-IP) gevirtualiseerd onder vSphere wordt gedraaid. Door de real-time eisen vallen zulke toepassingen in de zwaarste klasse die je kunt virtualiseren. De test is uitgevoerd met Mitel’s vMCD platform op Dell servers. Tevens werd de NetIOC feature van vSphere getest om de kwaliteit van het VoIP verkeer te verbeteren.

vMCD vSphere performance

Uit de conclusie:

This paper evaluated VoIP performance using a commercial media server to demonstrate that vSphere 5 is readily able to host VoIP service, delivering excellent out-of-the-box VoIP performance.  To compare voice quality of different configurations, jitter was used as the main metric that describes the timeliness of voice packet arrival. The evaluation results demonstrated that good voice quality was maintained when the number of users (number of voice streams) and media server instance increased, while fully utilizing CPU.  For example, vSphere 5 was able to maintain great VoIP performance even when running 12 instances of VoIP media server configured with a total 48 vCPUs on a system with 8 cores. It is further shown that the NetIOC feature was able to prevent packet loss successfully, thereby helping to preserve voice quality under severe contention for network.

Het rapport is hier als PDF van 10 pagina’s te downloaden.

Bron: Eric Sloof

Read Full Post »

Het Virtual Reality team heeft opnieuw een interessante whitepaper gepubliceerd. Dit keer zijn de performance gevolgen onderzocht van het gebruik van applicatie-virtualisatie in een Virtual Deskop Infrastructure omgeving.

Enkele resultaten:

  1. Als je een zware applicatie als Microsoft Office 2007 virtualiseert (wat overigens niet wordt aangeraden) dan kan je dat 20% tot 45% minder gebruikers kosten, die je aankunt met dezelfde VDI-omgeving. Voor minder zware applicaties ligt dat tussen 3% en 12%.
  2. Microsoft App-V en VMware ThinApp creëren ongeveer evenveel overhead; Citrix Application Streaming daarentegen een stuk meer.
  3. Application streaming resulteert in ongeveer 20% tot 44% minder lees-operaties en evenveel meer schrijf-operaties (dit laatste begrijp ik niet zo snel eerlijk gezegd, maar daar moet ik toch de whitepaper waarschijnlijk nog wat beter voor lezen …)

De whitepaper van 38 pagina’s is na registratie te downloaden op de Virtual Reality Check website.

Bron: Sven Huisman

Read Full Post »

Een onvermijdelijk gevolg van server-virtualisatie is dat een groot deel van de I/O afhandeling door de CPU’s moet worden uitgevoerd, in plaats van door externe Network Interface Cards (NIC’s) of Host Bus Adaptors (HBA’s). Voor data-verkeer tussen twee virtuele machines die in dezelfde fysieke server draaien is dat deel zelfs 100%.

Dit is altijd al een zorgpuntje geweest. De toename van CPU-kracht – vroeger door een hogere klok-snelheid, tegenwoordig door steeds meer cores en CPU’s – heeft die zorgen aan de ene kant verlicht. Daar staat dan wel tegenover dat je door die toename in kracht ook veel meer virtuele machines in dezelfde server gaat draaien. Hierdoor is de kans op data-verkeer die binnen die server blijft dus ook steeds groter. En omdat dat verkeer voor 100% door de cores / CPU’s afgehandeld moet worden heb je dus veel cores / CPU’s nodig. Lijkt een beetje op een hond die achter zijn eigen staart aan rent…

dog-chasing-tail

VMware heeft daarom een “performance study” gepubliceerd waarin gemeten is in hoeverre de CPU-power een bottleneck vormt bij dataverkeer, zowel binnen de machine als naar buiten. De resultaten zijn bemoedigend. Zo is het bij de gangbare servermodellen mogelijk om de vier 10 GbE NIC’s die zo’n machine meestal heeft zo goed als volledig te verzadigen vanuit 1 virtuele machine met 4 virtuele CPU’s. En 2 virtuele machines binnen dezelfde machine kunnen op zo’n 27 Gbps hun data onderling uitwisselen.

De performance study is hier als PDF-bestand van 13 pagina’s te downloaden.

Met dank aan Duncan Epping

Read Full Post »