RAID
Ein RAID-System (früher redundant array of inexpensive disks - heute redundant array of independent disks) diente anfangs dazu, mehrere kleine und günstige Festplatten zu einem großen Speicher zusammenzufassen.
Der Bedarf an Sicherheit für auf Festplatten gespeicherte Daten war zudem seit Entwicklung der ersten Festplatte ein Thema. Er wurde zunächst mit besonders aufwendig hergestellten und besonders auf Ausfallsicherheit optimierten Festplatten befriedigt - zu fürstlichen Preisen.
Die stets "klammen" Universitäten ersannen eine alternative Vorgehensweise: Redundante Verteilung der Daten auf mehrere (billige) Festplatten - geht eine kaputt, wird sie ersetzt. Das ist auch im laufenden Betrieb möglich.
Die Großrechner-Hersteller übernahmen diesen Ansatz und tauften ihn um in "Redundant Array of independant Disks", schließlich woll(t)en sie ja Geld verdienen.
Es existieren verschiedene RAID-Level mit unterschiedlichen Vor- und Nachteilen. Im Beispiel werden 5 Festplatten (A-E) verwendet.
Inhaltsverzeichnis
RAID 0 (Striping)
Bei RAID 0 werden mindestens zwei Festplatten so verbunden, dass die Daten gleichmäßig auf sie aufgeteilt werden.
Verschlechtert die Ausfallsicherheit, erhöht dafür die Geschwindigkeit, indem jede Datei auf alle Festplatten verteilt wird; so können alle gleichzeitig lesen/schreiben. Geht auch nur 1 Platte kaputt, fehlt JEDER Datei jeder n-te Datenblock (Schrotflinteneffekt!)
Zusammenfassung
Mind. benötigte Festplatten: 2
Redundanz: keine
Pro
- Hohe Geschwindigkeit
Contra
- Beim Ausfall einer Festplatte erfahren alle Daten den Schrotflinteneffekt; die verbleibenden Fragmente können u.U. gerettet werden.
RAID 1 (Mirroring)
Hohe Datensicherheit durch Mirroring (Spiegelung), mindestens zwei Festplatten. Die Daten auf den Festplatten sind sehr hoch gegen Ausfall einer der Festplatten geschützt. Alles, was auf Festplatte A gespeichert wird, kommt genau auf dieselbe Stelle auf Festplatte B. Wenn also eine der Platten ausfällt, sind die Daten noch auf der anderen vorhanden. Die Kapazität entspricht der kleinsten Festplatte im RAID.
Zusammenfassung
Mind. benötigte Festplatten: 2
Redundanz: einfach
Pro
- Hohe Datensicherheit
- Lesegeschwindigkeit: hoch, es kann parallel gelesen werden.
Contra
- Schreibgeschwindigkeit: Die der langsamsten Platte.
- nur 50% der gesamten Festplattenkapazität verfügbar, die andere Hälfte belegt die Spiegelung
RAID 2
wird nicht mehr verwendet
RAID 3
wird nicht mehr verwendet
RAID 4
xor/Parity - die zu speichernde Datei wird auf Festplatten A bis D verteilt gespeichert; die Sektoren gleicher Nummern werden XOR-verknüpft, das Ergebnis auf Festplatte E im Sektor gleicher Nummer gespeichert. Fällt E aus, kann man sie ersetzen und muss alle Prüfsummen neu berechnen; fällt von A-D eine Festplatte aus, kann ihr Inhalt aus den restlichen 3 und der Prüfsumme wiederhergestellt werden.
Pro:
- bei z.B. 5 Festplatten wird nur 1 für die Prüfsummen verbraucht (20%), 80% des gesamten Platzes ist für Daten verfügbar.
- gleichzeitiges Lesen ermöglicht hohe Lesegeschwindigkeit
- Speichern großer Dateien: Nach der Berechnung der Prüfsumme kann gleichzeitig geschrieben werden -> hohe Schreibgeschwindigkeit
- Kleine Dateien: Für die Prüfsummenberechnung muss vor dem Schreiben mitunter von den Platten gelesen werden, damit das Stripe-Set komplett vorliegt -> langsam
Nachteil:
- Festplatte E wird besonders stark belastet.
Raid-4 wird nicht mehr verwendet ~ eignet sich aber gut als Erklärungs-Einstieg für Raid-5 ;-)
RAID 5
Ein RAID 5 ist das komplizierteste Verfahren (beruht auf Raid-4), aber auch das System mit der besten Performance. Je mehr Festplatten am Controller angeschlossen sind, desto höher ist die Performance-Steigerung des Systems (ebenso wie bei Raid-0..6). Die Datensicherheit ist schlechter als bei einem RAID 1, da bei einem Raid-1 (aus z.B. 4 HDDs) u.U. 2 Festplatten ausfallen dürfen, bei einem Raid-5 niemals mehr als 1 gleichzeitig. Für ein RAID 5 werden mindestens 3 Festplatten benötigt.
RAID 5 funktioniert wie RAID 4., aber welche Festplatte von A bis E die Prüfsumme speichert, wird reihum durchgewechselt. Keine Festplatte wird außergewöhnlich stark belastet.
Zusammenfassung
Mind. benötigte Festplatten: 3
Redundanz: einfach
Pro
- Hohe Geschwindigkeit (wie bei Raid-4, v.a. beim Lesen)
- billiger als Raid-1 durch geringeren Verbrauch für Prüfsumme
Contra
- Höhere Anschaffungskosten (Controller)
RAID 6
RAID 6 ist ähnlich aufgebaut wie RAID 5, aber es wird nicht 1, sondern 2 oder mehrere Prüfsummen berechnet, sodass entsprechend 2 oder mehrere Festplatten zugleich ausfallen dürfen. Da bei der Neu-Einrichtung eines Raid-5 häufig Festplatten gleichen Herstellers, Modells, sogar Fabrikations-Charge verwendet werden, ist ein Ausfall einer zweiten Festplatte kurz nach dem Ausfall der ersten recht wahrscheinlich.
Raid-6 ist in großen Rechenzentren im Einsatz.
Die RAID-Level können auch kombiniert werden, z.B. 0+1 oder 5+0; dabei bedeutet 0+1 nicht dasselbe wie 1+0 !