RAID: Unterschied zwischen den Versionen

aus WB Wiki; freien Wissensdatenbank rund ums Thema Computer
Wechseln zu: Navigation, Suche
K (RAID 1)
K
 
(15 dazwischenliegende Versionen von 5 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
Ein RAID-System (früher redundant array of inexpensive disks - heute redundant array of independent disks) diente anfangs dazu mehrere kleine und günstige Festplatten zu einem großen Specher zusammenzufassen. Heute versucht man mit RAID die Datensicherheit zu erhöhen. Zu diesem Zweck existieren verschiedene RAID Level mit unterschiedlichen Vor- und Nachteilen.
+
Ein '''RAID'''-System (früher '''redundant array of inexpensive disks''' - heute '''redundant array of independent disks''') diente anfangs dazu, mehrere kleine und günstige [[Festplatte]]n zu einem großen Speicher zusammenzufassen.  
 +
 
 +
Der Bedarf an Sicherheit für auf [[Festplatte]]n gespeicherte Daten war zudem seit Entwicklung der ersten Festplatte ein Thema. Er wurde zunächst mit besonders aufwendig hergestellten und besonders auf Ausfallsicherheit optimierten Festplatten befriedigt - zu fürstlichen Preisen.  
 +
 
 +
Die stets "klammen" Universitäten ersannen eine alternative Vorgehensweise: [[Redundant]]e Verteilung der Daten auf mehrere (billige) Festplatten - geht eine kaputt, wird sie ersetzt. Das ist auch im laufenden Betrieb möglich.
 +
 
 +
Die Großrechner-Hersteller übernahmen diesen Ansatz und tauften ihn um in "Redundant Array of ''independant'' Disks", schließlich woll(t)en sie ja Geld verdienen.
 +
 
 +
Es existieren verschiedene RAID-Level mit unterschiedlichen Vor- und Nachteilen. Im Beispiel werden 5 Festplatten (A-E) verwendet.
  
 
== RAID 0 (Striping) ==
 
== RAID 0 (Striping) ==
Bei RAID 0 werden minestens zwei Festplatten so verbunden das die Daten gleichmäßig auf sie aufgeteilt werden. Dabei könne dadurch hohe Geschwindigkeit das gleichzeitig der Cache beider Festplatten genutzt und in dieser Zeit auch doppelt so viele Daten geschrieben/gelesen werden können.
+
Bei RAID 0 werden mindestens zwei Festplatten so verbunden, dass die Daten gleichmäßig auf sie aufgeteilt werden.  
<br />
+
 
 +
''Verschlechtert'' die Ausfallsicherheit, erhöht dafür die Geschwindigkeit, indem jede Datei auf alle Festplatten verteilt wird; so können alle gleichzeitig lesen/schreiben. Geht auch nur 1 Platte kaputt, fehlt JEDER Datei jeder n-te Datenblock (Schrotflinteneffekt!)
 
<br />
 
<br />
 
'''Zusammenfassung'''<br />
 
'''Zusammenfassung'''<br />
 
Mind. benötigte Festplatten: 2<br />
 
Mind. benötigte Festplatten: 2<br />
 
Redundanz: ''keine''<br />
 
Redundanz: ''keine''<br />
<br />
 
 
<span style="color: green">'''Pro'''</span>
 
<span style="color: green">'''Pro'''</span>
 
* Hohe Geschwindigkeit
 
* Hohe Geschwindigkeit
<br />
 
 
<span style="color: red">'''Contra'''</span>
 
<span style="color: red">'''Contra'''</span>
* Beim Ausfall einer Festplatte gehen alle Daten verloren
+
* Beim Ausfall einer Festplatte erfahren alle Daten den ''Schrotflinteneffekt''; die verbleibenden Fragmente können u.U. gerettet werden.
 
+
  
 
== RAID 1 (Mirroring) ==
 
== RAID 1 (Mirroring) ==
 
+
Hohe Datensicherheit durch Mirroring (Spiegelung), mindestens zwei Festplatten. Die Daten auf den Festplatten sind sehr hoch gegen Ausfall einer der Festplatten geschützt. Alles, was auf Festplatte A gespeichert wird, kommt genau auf dieselbe Stelle auf Festplatte B. Wenn also eine der Platten ausfällt, sind die Daten noch auf der anderen vorhanden. Die Kapazität entspricht der kleinsten Festplatte im RAID.
Hohe Datensicherheit durch mirroring (Spiegelung) mindestens zweier Festplatten sind die Daten auf den Festplatten sehr hoch durch Ausfall einer der Festplatten geschützt. Auf der zweiten Platte sind die gleichen Daten, wie auf der ersten Festplatte vorhanden. Wenn also eine der Platten ausfällt sind die Daten noch auf der anderen vorhanden. Die Kapazität entspricht der kleinsten Festplatte im RAID.
+
<br />
+
 
<br />
 
<br />
 
'''Zusammenfassung'''<br />
 
'''Zusammenfassung'''<br />
 
Mind. benötigte Festplatten: 2<br />
 
Mind. benötigte Festplatten: 2<br />
 
Redundanz: ''einfach''<br />
 
Redundanz: ''einfach''<br />
<br />
 
 
<span style="color: green">'''Pro'''</span>
 
<span style="color: green">'''Pro'''</span>
 
* Hohe Datensicherheit
 
* Hohe Datensicherheit
<br />
+
* Lesegeschwindigkeit: hoch, es kann parallel gelesen werden.
 
<span style="color: red">'''Contra'''</span>
 
<span style="color: red">'''Contra'''</span>
* Niedrigere Geschwindigkeit da alle Daten doppelt geschrieben werden
+
* Schreibgeschwindigkeit: Die der langsamsten Platte.
 +
* nur 50% der gesamten Festplattenkapazität verfügbar, die andere Hälfte belegt die Spiegelung
  
== RAID 5: ==
+
== RAID 2 ==
+
wird nicht mehr verwendet
Ein RAID 5 ist das teuerste, aber auch das System mit der besten Performance.
+
 
Je mehr Festplatten am Controller angeschlossen sind, desto höher ist die Performancesteigerung des Systems.  
+
== RAID 3 ==
Die Datensicherheit ist ähnlich wie bei einem RAID 1.
+
wird nicht mehr verwendet
 +
 
 +
== RAID 4 ==
 +
''[[xor]]''/''[[Parity]]'' - die zu speichernde Datei wird auf Festplatten A bis D verteilt gespeichert; die [[Sektor]]en gleicher Nummern werden XOR-verknüpft, das Ergebnis auf Festplatte E im Sektor gleicher Nummer gespeichert. Fällt E aus, kann man sie ersetzen und muss alle Prüfsummen neu berechnen; fällt von A-D eine Festplatte aus, kann ihr Inhalt aus den restlichen 3 und der Prüfsumme wiederhergestellt werden.<br />
 +
Pro:
 +
* bei z.B. 5 Festplatten wird nur 1 für die Prüfsummen verbraucht (20%), 80% des gesamten Platzes ist für Daten verfügbar.
 +
* gleichzeitiges Lesen ermöglicht hohe Lesegeschwindigkeit
 +
* Speichern großer Dateien: Nach der Berechnung der Prüfsumme kann gleichzeitig geschrieben werden -> hohe Schreibgeschwindigkeit
 +
* Kleine Dateien: Für die Prüfsummenberechnung muss vor dem Schreiben mitunter von den Platten gelesen werden, damit das Stripe-Set komplett vorliegt -> langsam
 +
Nachteil:
 +
* Festplatte E wird besonders stark belastet.
 +
 
 +
Raid-4 wird nicht mehr verwendet ~ eignet sich aber gut als Erklärungs-Einstieg für Raid-5 ;-)
 +
 
 +
== RAID 5 ==
 +
Ein RAID 5 ist das komplizierteste Verfahren (beruht auf Raid-4), aber auch das System mit der besten Performance.
 +
Je mehr Festplatten am [[Controller]] angeschlossen sind, desto höher ist die Performance-Steigerung des Systems (ebenso wie bei Raid-0..6).  
 +
Die Datensicherheit ist schlechter als bei einem RAID 1, da bei einem Raid-1 (aus z.B. 4 HDDs) u.U. 2 Festplatten ausfallen dürfen, bei einem Raid-5 niemals mehr als 1 gleichzeitig.
 
Für ein RAID 5 werden mindestens 3 Festplatten benötigt.
 
Für ein RAID 5 werden mindestens 3 Festplatten benötigt.
 +
 +
RAID 5 funktioniert wie RAID 4., aber welche Festplatte von A bis E die Prüfsumme speichert, wird reihum durchgewechselt. Keine Festplatte wird außergewöhnlich stark belastet.
 +
 +
'''Zusammenfassung'''<br />
 +
Mind. benötigte Festplatten: 3<br />
 +
Redundanz: ''einfach''<br />
 +
<span style="color: green">'''Pro'''</span>
 +
* Hohe Geschwindigkeit (wie bei Raid-4, v.a. beim Lesen)
 +
* billiger als Raid-1 durch geringeren Verbrauch für Prüfsumme
 +
<span style="color: red">'''Contra'''</span>
 +
* Höhere Anschaffungskosten (Controller)
 +
 +
== RAID 6 ==
 +
RAID 6 ist ähnlich aufgebaut wie RAID 5, aber es wird nicht 1, sondern 2 oder mehrere Prüfsummen berechnet, sodass entsprechend 2 oder mehrere Festplatten zugleich ausfallen dürfen. Da bei der Neu-Einrichtung eines Raid-5 häufig Festplatten gleichen Herstellers, Modells, sogar Fabrikations-Charge verwendet werden, ist ein Ausfall einer zweiten Festplatte kurz nach dem Ausfall der ersten recht wahrscheinlich.<br />
 +
Raid-6 ist in großen Rechenzentren im Einsatz.
 +
 +
 +
Die RAID-Level können auch kombiniert werden, z.B. 0+1 oder 5+0; dabei bedeutet 0+1 nicht dasselbe wie 1+0 !

Aktuelle Version vom 21. Januar 2009, 16:50 Uhr

Ein RAID-System (früher redundant array of inexpensive disks - heute redundant array of independent disks) diente anfangs dazu, mehrere kleine und günstige Festplatten zu einem großen Speicher zusammenzufassen.

Der Bedarf an Sicherheit für auf Festplatten gespeicherte Daten war zudem seit Entwicklung der ersten Festplatte ein Thema. Er wurde zunächst mit besonders aufwendig hergestellten und besonders auf Ausfallsicherheit optimierten Festplatten befriedigt - zu fürstlichen Preisen.

Die stets "klammen" Universitäten ersannen eine alternative Vorgehensweise: Redundante Verteilung der Daten auf mehrere (billige) Festplatten - geht eine kaputt, wird sie ersetzt. Das ist auch im laufenden Betrieb möglich.

Die Großrechner-Hersteller übernahmen diesen Ansatz und tauften ihn um in "Redundant Array of independant Disks", schließlich woll(t)en sie ja Geld verdienen.

Es existieren verschiedene RAID-Level mit unterschiedlichen Vor- und Nachteilen. Im Beispiel werden 5 Festplatten (A-E) verwendet.

RAID 0 (Striping)

Bei RAID 0 werden mindestens zwei Festplatten so verbunden, dass die Daten gleichmäßig auf sie aufgeteilt werden.

Verschlechtert die Ausfallsicherheit, erhöht dafür die Geschwindigkeit, indem jede Datei auf alle Festplatten verteilt wird; so können alle gleichzeitig lesen/schreiben. Geht auch nur 1 Platte kaputt, fehlt JEDER Datei jeder n-te Datenblock (Schrotflinteneffekt!)
Zusammenfassung
Mind. benötigte Festplatten: 2
Redundanz: keine
Pro

  • Hohe Geschwindigkeit

Contra

  • Beim Ausfall einer Festplatte erfahren alle Daten den Schrotflinteneffekt; die verbleibenden Fragmente können u.U. gerettet werden.

RAID 1 (Mirroring)

Hohe Datensicherheit durch Mirroring (Spiegelung), mindestens zwei Festplatten. Die Daten auf den Festplatten sind sehr hoch gegen Ausfall einer der Festplatten geschützt. Alles, was auf Festplatte A gespeichert wird, kommt genau auf dieselbe Stelle auf Festplatte B. Wenn also eine der Platten ausfällt, sind die Daten noch auf der anderen vorhanden. Die Kapazität entspricht der kleinsten Festplatte im RAID.
Zusammenfassung
Mind. benötigte Festplatten: 2
Redundanz: einfach
Pro

  • Hohe Datensicherheit
  • Lesegeschwindigkeit: hoch, es kann parallel gelesen werden.

Contra

  • Schreibgeschwindigkeit: Die der langsamsten Platte.
  • nur 50% der gesamten Festplattenkapazität verfügbar, die andere Hälfte belegt die Spiegelung

RAID 2

wird nicht mehr verwendet

RAID 3

wird nicht mehr verwendet

RAID 4

xor/Parity - die zu speichernde Datei wird auf Festplatten A bis D verteilt gespeichert; die Sektoren gleicher Nummern werden XOR-verknüpft, das Ergebnis auf Festplatte E im Sektor gleicher Nummer gespeichert. Fällt E aus, kann man sie ersetzen und muss alle Prüfsummen neu berechnen; fällt von A-D eine Festplatte aus, kann ihr Inhalt aus den restlichen 3 und der Prüfsumme wiederhergestellt werden.
Pro:

  • bei z.B. 5 Festplatten wird nur 1 für die Prüfsummen verbraucht (20%), 80% des gesamten Platzes ist für Daten verfügbar.
  • gleichzeitiges Lesen ermöglicht hohe Lesegeschwindigkeit
  • Speichern großer Dateien: Nach der Berechnung der Prüfsumme kann gleichzeitig geschrieben werden -> hohe Schreibgeschwindigkeit
  • Kleine Dateien: Für die Prüfsummenberechnung muss vor dem Schreiben mitunter von den Platten gelesen werden, damit das Stripe-Set komplett vorliegt -> langsam

Nachteil:

  • Festplatte E wird besonders stark belastet.

Raid-4 wird nicht mehr verwendet ~ eignet sich aber gut als Erklärungs-Einstieg für Raid-5 ;-)

RAID 5

Ein RAID 5 ist das komplizierteste Verfahren (beruht auf Raid-4), aber auch das System mit der besten Performance. Je mehr Festplatten am Controller angeschlossen sind, desto höher ist die Performance-Steigerung des Systems (ebenso wie bei Raid-0..6). Die Datensicherheit ist schlechter als bei einem RAID 1, da bei einem Raid-1 (aus z.B. 4 HDDs) u.U. 2 Festplatten ausfallen dürfen, bei einem Raid-5 niemals mehr als 1 gleichzeitig. Für ein RAID 5 werden mindestens 3 Festplatten benötigt.

RAID 5 funktioniert wie RAID 4., aber welche Festplatte von A bis E die Prüfsumme speichert, wird reihum durchgewechselt. Keine Festplatte wird außergewöhnlich stark belastet.

Zusammenfassung
Mind. benötigte Festplatten: 3
Redundanz: einfach
Pro

  • Hohe Geschwindigkeit (wie bei Raid-4, v.a. beim Lesen)
  • billiger als Raid-1 durch geringeren Verbrauch für Prüfsumme

Contra

  • Höhere Anschaffungskosten (Controller)

RAID 6

RAID 6 ist ähnlich aufgebaut wie RAID 5, aber es wird nicht 1, sondern 2 oder mehrere Prüfsummen berechnet, sodass entsprechend 2 oder mehrere Festplatten zugleich ausfallen dürfen. Da bei der Neu-Einrichtung eines Raid-5 häufig Festplatten gleichen Herstellers, Modells, sogar Fabrikations-Charge verwendet werden, ist ein Ausfall einer zweiten Festplatte kurz nach dem Ausfall der ersten recht wahrscheinlich.
Raid-6 ist in großen Rechenzentren im Einsatz.


Die RAID-Level können auch kombiniert werden, z.B. 0+1 oder 5+0; dabei bedeutet 0+1 nicht dasselbe wie 1+0 !