Prestaties van Disk Array-opslagsystemen in een enkele hostverbinding

Over het algemeen leveren schijven of schijfarrays de beste prestaties in een scenario met een enkele hostverbinding. De meeste besturingssystemen zijn gebaseerd op exclusieve bestandssystemen, wat betekent dat een bestandssysteem slechts eigendom kan zijn van één besturingssysteem. Als gevolg hiervan optimaliseren zowel het besturingssysteem als de applicatiesoftware het lezen en schrijven van gegevens voor het schijfopslagsysteem op basis van zijn kenmerken. Deze optimalisatie heeft tot doel de fysieke zoektijden te verkorten en de mechanische responstijden van de schijf te verkorten. De gegevensverzoeken van elk programmaproces worden afgehandeld door het besturingssysteem, wat resulteert in geoptimaliseerde en geordende gegevenslees- en schrijfverzoeken voor de schijf of schijfarray. Dit leidt tot de beste prestaties van het opslagsysteem in deze opstelling.

Voor disk-arrays beheren en verifiëren de huidige RAID-controllers voornamelijk schijffouttolerantiebewerkingen, hoewel er een extra RAID-controller is toegevoegd tussen het besturingssysteem en de afzonderlijke schijfstations. Ze voeren geen samenvoeging, herschikking of optimalisatie van gegevensverzoeken uit. RAID-controllers zijn ontworpen op basis van de veronderstelling dat gegevensverzoeken afkomstig zijn van één enkele host, die al door het besturingssysteem is geoptimaliseerd en gesorteerd. De cache van de controller biedt alleen directe en computationele buffermogelijkheden, zonder gegevens in de wachtrij te plaatsen voor optimalisatie. Wanneer de cache snel gevuld is, daalt de snelheid onmiddellijk naar de werkelijke snelheid van de schijfbewerkingen.

De primaire functie van de RAID-controller is het creëren van één of meer grote fouttolerante schijven van meerdere schijven en het verbeteren van de algehele lees- en schrijfsnelheid van gegevens met behulp van de cachingfunctie op elke schijf. De leescache van RAID-controllers verbetert de leesprestaties van de disk-array aanzienlijk wanneer dezelfde gegevens binnen korte tijd worden gelezen. De werkelijke maximale lees- en schrijfsnelheid van de gehele disk-array wordt beperkt door de laagste waarde van de hostkanaalbandbreedte, de verificatieberekening van de controller-CPU en de systeemcontrolemogelijkheden (RAID-engine), schijfkanaalbandbreedte en schijfprestaties (de gecombineerde werkelijke prestaties van alle schijven). Bovendien kan een mismatch tussen de optimalisatiebasis van de dataverzoeken van het besturingssysteem en het RAID-formaat, zoals de blokgrootte van I/O-verzoeken die niet in lijn zijn met de RAID-segmentgrootte, een aanzienlijke invloed hebben op de prestaties van de disk-array.

Prestatievariaties van traditionele Disk Array-opslagsystemen bij toegang via meerdere hosts

In scenario's met meerdere hosttoegang nemen de prestaties van diskarrays af in vergelijking met verbindingen met één host. In kleinschalige disk-array-opslagsystemen, die doorgaans een enkel of redundant paar disk-array-controllers en een beperkt aantal aangesloten schijven hebben, worden de prestaties beïnvloed door de ongeordende gegevensstromen van verschillende hosts. Dit leidt tot langere schijfzoektijden, kop- en staartinformatie van gegevenssegmenten en gegevensfragmentatie voor lees-, samenvoeg-, verificatieberekeningen en herschrijfprocessen. Bijgevolg nemen de opslagprestaties af naarmate er meer hosts zijn aangesloten.

Bij grootschalige disk-array-opslagsystemen is de prestatievermindering anders dan bij kleinschalige disk-arrays. Deze grootschalige systemen maken gebruik van een busstructuur of kruispuntschakelstructuur om meerdere opslagsubsystemen (schijfarrays) met elkaar te verbinden en omvatten caches met grote capaciteit en hostverbindingsmodules (vergelijkbaar met kanaalhubs of switches) voor meer hosts binnen de bus of schakelsystemen. structuur. De prestaties zijn grotendeels afhankelijk van de cache in transactieverwerkingstoepassingen, maar hebben een beperkte effectiviteit in multimediagegevensscenario's. Hoewel de interne disk-array-subsystemen in deze grootschalige systemen relatief onafhankelijk werken, wordt een enkele logische eenheid slechts binnen een enkel schijfsubsysteem gebouwd. De prestaties van een enkele logische eenheid blijven dus laag.

Concluderend kunnen we stellen dat kleinschalige disk-arrays een prestatiedaling ervaren als gevolg van ongeordende datastromen, terwijl grootschalige disk-arrays met meerdere onafhankelijke disk-array-subsystemen meer hosts kunnen ondersteunen, maar nog steeds te maken krijgen met beperkingen voor multimediadatatoepassingen. Aan de andere kant ervaren NAS-opslagsystemen die zijn gebaseerd op traditionele RAID-technologie en die NFS- en CIFS-protocollen gebruiken om opslag te delen met externe gebruikers via Ethernet-verbindingen, minder prestatieverlies in omgevingen met meerdere hosttoegangen. NAS-opslagsystemen optimaliseren de gegevensoverdracht met behulp van meerdere parallelle TCP/IP-overdrachten, waardoor een maximale gedeelde snelheid van ongeveer 60 MB/s in één NAS-opslagsysteem mogelijk wordt. Door het gebruik van Ethernet-verbindingen kunnen de gegevens na beheer en herschikking door het besturingssysteem of de gegevensbeheersoftware in de thin server optimaal naar het schijfsysteem worden geschreven. Daarom ondervindt het schijfsysteem zelf geen significante prestatievermindering, waardoor NAS-opslag geschikt is voor toepassingen die het delen van gegevens vereisen.


Posttijd: 17 juli 2023