Synology SHR1-Datenwiederherstellung nach Ausfall von zwei Festplatten

Zwei Festplatten sind in Ihrem Synology SHR-1-Array ausgefallen. DSM meldet den Speicherpool als abgestürzt und gibt an, dass die Daten nicht wiederhergestellt werden können. Die Datenrettung bei SHR-1 nach einem doppelten Festplattenausfall ist Gegenstand dieses Artikels – und die Situation ist differenzierter, als die DSM-Meldung vermuten lässt. Ob Ihre Daten wiederherstellbar sind, hängt nicht allein von der Anzahl der ausgefallenen Laufwerke ab, sondern davon, wie sie ausgefallen sind und in welchem Zustand sich die verbleibenden Laufwerke befinden.

Zuerst die eigene Ausgangssituation bestimmen

Nutzen Sie vor dem Weiterlesen diese Tabelle, um Ihr konkretes Szenario zu identifizieren und direkt zum relevanten Abschnitt zu springen:

Beobachtung	Wahrscheinliche Situation	Wiederherstellungsaussicht	Weiter zu
Beide Laufwerke werden im Betriebssystem angezeigt, Superblöcke lesbar	Logischer Fehler — Laufwerke physisch intakt	Möglich	Level 1 → Level 2
Ein Laufwerk lesbar, eines nicht erkannt	Ein logischer und ein physischer Defekt	Teilweise	Level 2 → Level 3
Zweites Laufwerk fällt während des Rebuilds nach dem ersten aus	Klassischer Doppelausfall — teilweiser Datenverlust wahrscheinlich	Teilweise	Level 2
Ein oder beide Laufwerke klicken, schleifen oder werden nicht erkannt	Physischer Defekt — Schreib-/Leseköpfe oder Platten betroffen	Datenrettung im Labor erforderlich	Level 3

Warum zwei Ausfälle SHR-1 mathematisch zerstören

SHR-1 verwendet ein einzelnes Paritätsset – konzeptionell vergleichbar mit RAID 5 in Bezug auf die Fehlertoleranz. Für jeden Stripe im Array wird die XOR-Parität der übrigen Blöcke auf einem Laufwerk gespeichert. Fällt ein Laufwerk aus, kann jeder fehlende Datenblock neu berechnet werden: Man nimmt den Paritätsblock und verknüpft ihn per XOR mit allen verbleibenden Datenblöcken; so wird der fehlende Wert wiederhergestellt. Das funktioniert, weil genau eine Unbekannte und eine Gleichung vorliegen.

Bei zwei ausgefallenen Laufwerken gibt es pro Stripe zwei Unbekannte, aber weiterhin nur eine Paritätsgleichung. Die Mathematik ist damit nicht mehr lösbar. Keine Software, unabhängig von ihrer Vermarktung, kann zwei unabhängig unbekannte Werte aus einer einzigen XOR-Beziehung rekonstruieren. Das ist keine Einschränkung eines bestimmten Tools, sondern eine Eigenschaft des Paritätsschemas selbst.

Was Software kann, ist die Wiederherstellung von Daten aus Stripes, an denen nur eines der beiden ausgefallenen Laufwerke beteiligt war. Befinden sich Ihre Dateien zufällig auf Stripes, die keines der beiden ausgefallenen Laufwerke berühren, sind sie wiederherstellbar. Dateien, die sich über Stripes erstrecken, in denen beide betroffenen Laufwerke enthalten sind, sind es nicht. Der Anteil der wiederherstellbaren Daten hängt von Größe und Verteilung der ausgefallenen Laufwerke innerhalb des Arrays ab – deshalb ist eine teilweise Datenrettung oft möglich, selbst wenn eine vollständige Wiederherstellung nicht mehr machbar ist.

📌 Hinweis zu SHR-2

SHR-2 speichert pro Stripe zwei unabhängige Paritätssets – analog zu RAID 6 – und toleriert zwei gleichzeitige Laufwerksausfälle ohne Datenverlust. SHR-2 ist jedoch nicht gegen dieses Szenario immun: Drei gleichzeitige Ausfälle zerstören die Paritätslogik auf dieselbe Weise, wie zwei Ausfälle SHR-1 zerstören. Wenn Sie SHR-2 einsetzen und drei Laufwerke verloren haben, gilt die folgende Logik ebenfalls. Einen praktischen Vergleich der Ausfallsicherheit von SHR-1 und SHR-2 finden Sie in unserem Artikel zur SHR-/SHR-2-Datenrettung nach einem Synology-Hardwareausfall.

Die Art des Ausfalls der beiden Laufwerke ist entscheidend

Nicht alle doppelten Laufwerksausfälle sind gleich. Die Reihenfolge und Art der Ausfälle bestimmen, welche Datenwiederherstellung möglich ist:

⚡

Gleichzeitiger Ausfall — Stromereignis oder Controller-Problem

Beide Laufwerke haben im selben Moment nicht mehr reagiert. Die Daten auf jedem Laufwerk sind wahrscheinlich physisch intakt — das RAID-Array hat lediglich das Quorum verloren. Dies ist die am besten wiederherstellbare Form eines doppelten Festplattenausfalls, da auf keines der beiden Laufwerke Daten teilweise überschrieben wurden.

🔄

Zweites Laufwerk während des Rebuilds ausgefallen

Das erste Laufwerk ist ausgefallen, das Array lief im Degraded-Modus, und ein Rebuild wurde gestartet — dann fiel das zweite Laufwerk während des Wiederaufbaus aus. Die neue Parität wurde gerade auf das Ersatzlaufwerk geschrieben, als das zweite ursprüngliche Laufwerk ausfiel. Stripes, die vor dem zweiten Ausfall bereits wiederhergestellt wurden, sind intakt; Stripes, die zum Zeitpunkt des zweiten Ausfalls gerade wieder aufgebaut wurden, sind beschädigt. Eine Teilwiederherstellung ist in der Regel möglich.

⏳

Erstes Laufwerk ist bereits vor längerer Zeit unbemerkt ausgefallen

Das RAID-Array lief über einen längeren Zeitraum im degradierten Modus — also ohne Redundanz — und anschließend fiel das zweite Laufwerk aus. Wenn der erste Ausfall unentdeckt blieb, können in der Zwischenzeit weitere Schreibvorgänge auf degradierte Stripes erfolgt sein. Die Wiederherstellungschancen hängen vollständig vom physischen Zustand des zweiten ausgefallenen Laufwerks ab. In unserem Artikel zu frühen Anzeichen eines Festplattenausfalls erkennen erfahren Sie, wie sich ein solcher Defekt früher identifizieren lässt.

Den physischen Zustand jedes Laufwerks prüfen

Vor jedem softwareseitigen Vorgehen ist zu prüfen, ob die Laufwerke physisch lesbar sind. Fahren Sie das NAS sauber herunter, falls es noch läuft — kein erzwungenes Neustarten und kein Einsetzen eines Ersatzlaufwerks, da DSM andernfalls einen weiteren Rebuild anstoßen würde. Verbinden Sie jedes Laufwerk einzeln mit einem Recovery-System.

Wenn ein Laufwerk hörbares Klicken, Schleifgeräusche oder wiederholte erfolglose Anlaufversuche verursacht, schalten Sie es sofort aus und nehmen Sie keine weiteren Leseversuche vor. Jeder Anlaufzyklus bei einem Laufwerk mit beschädigten Köpfen erhöht den Schaden an den Plattern. Wechseln Sie direkt zu Level 3.

Bei Laufwerken, die geräuschlos hochfahren, führen Sie mdadm --examine für jede Gerätepartition aus:

Superblock-Status auf jedem Laufwerk prüfen

	mdadm --examine /dev/sdb3
	          Magic : a92b4efc
	        Version : 1.2
	    Feature Map : 0x0
	     Array UUID : 4b2f8e1a:7c3d9f02:1a4b8c3d:9e2f7b01
	           Name : DiskStation:2
	  Creation Time : Fri Mar 10 14:22:31 2023
	     Raid Level : raid5
	   Raid Devices : 3
	 Avail Dev Size : 7813959680
	     Array Size : 15627862016
	  Used Dev Size : 7813931008
	    Data Offset : 2048 sectors
	   Super Offset : 8 sectors
	   Unused Space : before=1968 sectors, after=0 sectors
	          State : clean, degraded
	
	    Device UUID : 9d3f1c2a:4e8b7f03:2c1d9e4b:7a3f8c01
	    Update Time : Mon Jun  2 09:14:22 2025
	  Bad Block Log : 512 entries available at offset 16 sectors
	       Checksum : 3f8a1b2c - correct
	         Events : 247

Achten Sie auf drei Punkte: Die Array-UUID muss auf allen Laufwerken identisch sein — ist das nicht der Fall, stammt ein Laufwerk aus einem anderen Array oder der Superblock ist beschädigt. Der Zähler Events sollte bei allen Mitgliedern ähnlich sein — eine starke Abweichung weist darauf hin, dass ein Laufwerk einen erheblichen Teil der Schreibvorgänge verpasst hat. Das Feld State zeigt auf einem Laufwerk, das zu einem Array gehörte und ein Mitglied verloren hat, clean, degraded an.

Öffnen Sie an dieser Stelle außerdem den integrierten S.M.A.R.T.-Monitor in RS RAID Retrieve. Besonders wichtig sind auf einem verbleibenden Laufwerk der Reallocated Sector Count und die Pending Sectors: Ein Laufwerk mit zunehmenden Bad Sectors während einer bereits degradierten Phase kann stille Lesefehler verursacht haben, die die Datenintegrität bereits vor dem zweiten Ausfall beeinträchtigt haben. Hintergrundinformationen zur Interpretation von S.M.A.R.T.-Daten finden Sie in unserem Artikel zu Anzeichen eines Festplattenausfalls.

Drei Wiederherstellungsstufen

🖥️

Stufe 1 Manuelle Wiederherstellung über das Linux-Terminal

Schwierigkeitsgrad:

Niedrig

Dieser Ansatz sollte nur verwendet werden, wenn mdadm --examine auf allen Laufwerken gültige Superblöcke mit übereinstimmenden UUIDs zurückgibt. Die Arbeit im Terminal bietet direkte Kontrolle über jeden Schritt, hat jedoch klare Grenzen: Alle Laufwerke müssen physisch vorhanden und lesbar sein, bei beschädigten Superblöcken gibt es keinen Fallback, und im Vorfeld lässt sich nicht erkennen, welche Dateien beschädigt sind. Erstellen Sie daher vor der Ausführung der folgenden Befehle mit ddrescue ein Image von jedem Laufwerk — arbeiten Sie ausschließlich mit den Images.

Schritt 1 — Zunächst jedes Laufwerk als Image sichern

	# ddrescue installieren, falls nicht vorhanden
	apt-get install -y gddrescue
	# Jedes Laufwerk in eine separate Image-Datei sichern — für jedes Mitglied ausführen
	ddrescue -d -r3 /dev/sdb /mnt/images/sdb.img /mnt/images/sdb.log
	ddrescue -d -r3 /dev/sdc /mnt/images/sdc.img /mnt/images/sdc.log
	ddrescue -d -r3 /dev/sdd /mnt/images/sdd.img /mnt/images/sdd.log

Der Schalter -r3 weist ddrescue an, nicht lesbare Sektoren dreimal erneut zu lesen, bevor sie als fehlerhaft markiert werden. Die .log-Datei ermöglicht das Fortsetzen der Erstellung des Laufwerks-Images nach einer Unterbrechung. Dieser Schritt darf nicht übersprungen werden — ein Datenträger mit versteckten fehlerhaften Sektoren verschlechtert sich unter der anhaltenden Lese-/I/O-Last einer RAID-Rekonstruktion weiter.

Schritt 2 — Superblöcke aller Mitglieder überprüfen

		# Auf jedem Image ausführen — UUID und Events abgleichen
		mdadm --examine /mnt/images/sdb.img
		mdadm --examine /mnt/images/sdc.img
		mdadm --examine /mnt/images/sdd.img

Vor dem Fortfahren sind drei Punkte zu prüfen. Die Array UUID muss in allen Images identisch sein — eine Abweichung bedeutet, dass das Laufwerk zu einem anderen RAID-Array gehört oder der Superblock beschädigt ist. Der Zähler Events sollte bei allen Mitgliedern nahezu identisch sein — eine Differenz von Hunderten oder Tausenden deutet darauf hin, dass ein Laufwerk eine größere Anzahl von Schreibvorgängen verpasst hat. Die Anzahl der Raid Devices muss der erwarteten Anzahl der Mitglieder entsprechen.

Schritt 3 — Zusammenstellung erzwungen aus Image-Dateien

	# Den Kernel anweisen, Image-Dateien als Blockgeräte zu behandeln
	losetup /dev/loop0 /mnt/images/sdb.img
	losetup /dev/loop1 /mnt/images/sdc.img
	losetup /dev/loop2 /mnt/images/sdd.img
	# Erzwungene Zusammenstellung — die Datenpartitionen angeben, nicht das gesamte Gerät
	mdadm --assemble --force /dev/md0 /dev/loop0p3 /dev/loop1p3 /dev/loop2p3
	# Zusammenstellungsergebnis prüfen
	cat /proc/mdstat
	mdadm --detail /dev/md0

--force setzt das RAID-Array auch dann zusammen, wenn nicht genügend Mitglieder für einen konsistenten Zustand vorhanden sind. Das resultierende Array ist degradiert. Stripe-Segmente, an denen beide ausgefallenen Laufwerke beteiligt waren, enthalten fehlerhafte, aus Paritätsdaten rekonstruierten Inhalte — Dateien auf diesen Stripe-Segmenten sind beim Kopieren beschädigt oder haben eine Größe von 0 Byte. Dateien auf Stripe-Segmenten, die nur ein ausgefallenes Laufwerk betrafen, sind intakt und lesbar. Von außen lässt sich vor einem Kopierversuch nicht erkennen, welche Dateien in welche Kategorie fallen.

Schritt 4 — LVM aktivieren und nur lesend einbinden

	# LVM-Volume-Group auf dem zusammengesetzten Array aktivieren
	pvscan
	vgchange -ay
	# Logische Volumes auflisten, um den korrekten Gerätepfad zu ermitteln
	lvs
	# Nur lesend einbinden — ein beschädigtes Array niemals mit Schreibzugriff mounten
	mount /dev/vg1/volume_1 /mnt/data -o ro

Die Einbindung muss immer mit -o ro erfolgen. Jede Schreiboperation auf ein zwangsweise zusammengesetztes Array in diesem Zustand würde die Beschädigung auf zuvor intakte Stripes ausweiten. Nach dem Mounten sollten die Verzeichnisstruktur und die Dateigrößen geprüft werden, bevor ein Kopiervorgang gestartet wird. Beschädigte Dateien äußern sich beim Kopieren durch Lesefehler, I/O-Fehler oder Ausgaben mit 0 Byte — eine Vorwarnung gibt es nicht.

Schritt 5 — Kopieren mit Fehlerbehandlung

	# rsync mit Fehlerprotokollierung verwenden — überspringt nicht lesbare Dateien, anstatt abzubrechen
	rsync -av --ignore-errors /mnt/data/ /mnt/destination/ 2>&1 | tee /mnt/rsync.log
	# Prüfen, welche Dateien übersprungen wurden
	grep -i "error|failed|cannot" /mnt/rsync.log

Das Standardprogramm cp bricht beim ersten Lesefehler ab. rsync --ignore-errors protokolliert den Fehler und fährt mit der nächsten Datei fort, um die insgesamt wiederherstellbare Datenmenge zu maximieren. Überprüfen Sie anschließend das Protokoll, um zu ermitteln, welche Dateien nicht kopiert werden konnten — dabei handelt es sich um die Dateien auf Stripes, die beide ausgefallenen Laufwerke umfassen.

Wann Sie abbrechen und zu Stufe 2 wechseln sollten: mdadm --examine zeigt nicht übereinstimmende UUIDs zwischen den Laufwerken; das Zusammenfügen mit --force schlägt fehl oder erzeugt ein inactive-Array in /proc/mdstat; bei der LVM-Aktivierung wird keine Volume Group gefunden; das Dateisystem lässt sich einhängen, zeigt jedoch eine leere oder beschädigte Verzeichnisstruktur. In all diesen Fällen sind Superblock oder LVM-Metadaten zu stark beschädigt für eine manuelle Wiederherstellung — der RAID-Constructor von RS RAID Retrieve kann diese Fälle verarbeiten.

🖥️

Stufe 2 RS RAID Retrieve — automatische Erkennung und manuelle Rekonstruktion

Schwierigkeit:

Niedrig

RS RAID Retrieve deckt die gesamte Abfolge — S.M.A.R.T.-Analyse, Laufwerks-Image-Erstellung, Array-Rekonstruktion, LVM-Aktivierung und Dateisystemzugriff — in einer einzigen Anwendung unter Windows, Linux oder macOS ab. Je nach Zustand der mdadm-Superblöcke unterstützt die Software zwei unterschiedliche Rekonstruktionspfade.

S.M.A.R.T.-Analyse – vor jedem Lesevorgang

Verbinden Sie alle Laufwerke mit dem Recovery-System und öffnen Sie vor dem Auslesen den integrierten S.M.A.R.T.-Monitor. In diesem Szenario sind vor allem die Attribute Reallocated Sector Count (ID 05), Current Pending Sector Count (ID C5) und Uncorrectable Sector Count (ID C6) relevant. Von Null abweichende Werte bei einem dieser Attribute – insbesondere bei Laufwerken, die als „intakte“ Überlebende erscheinen – weisen auf Sektoren hin, die bereits während der Phase mit eingeschränkter Redundanz vor dem Ausfall des zweiten Laufwerks fehlerhaft waren. Ein verbliebenes Laufwerk mit erhöhtem Pending-Sector-Wert kann während eines mehrstündigen Rekonstruktions-Scans Lesefehler verursachen.

Drive-Imaging – Originale vor Scan-Belastung schützen

Bei allen Laufwerken mit erhöhten S.M.A.R.T.-Werten sollte vor dem Rekonstruktions-Scan die integrierte Imaging-Funktion von RS RAID Retrieve verwendet werden, um ein Sektor-für-Sektor-Image zu erstellen. Der Imager führt mehrere Durchläufe über problematische Sektoren aus, protokolliert nicht lesbare Bereiche in einer Sektorenkarte und erzeugt eine vollständige Image-Datei, die den bestmöglichen Lesezustand dieses Laufwerks abbildet. Alle nachfolgenden Schritte — Array-Rekonstruktion, LVM-Aktivierung, Dateisystem-Scan — werden gegen die statische Image-Datei statt gegen das physische Laufwerk ausgeführt. Dadurch wird verhindert, dass sich das Laufwerk unter der Lese-Last eines vollständigen Array-Scans weiter verschlechtert, was bei einer Multi-Terabyte-SHR-Konfiguration mehrere Stunden dauern kann.

Automatische RAID-Array-Rekonstruktion – bei intakten Superblöcken

RS RAID Retrieve durchsucht alle angeschlossenen Laufwerke und Images nach mdadm-Superblock-Signaturen. Wird eine Signatur gefunden, liest die Software die Array-UUID, den RAID-Level, die Rollen der Mitgliedsgeräte, die Stripe-Blockgröße und die Event-Zähler aller Mitglieder aus. Anschließend rekonstruiert sie die SHR-Volume-Struktur — mdadm-Array → LVM Physical Volume → Volume Group → Logical Volume → Btrfs- oder ext4-Dateisystem — ohne gültiges Quorum und ohne Schreibzugriffe auf die Quelldatenträger. Bei einem Doppeldefekt, bei dem beide Laufwerke physisch lesbar sind und die Superblöcke intakt sind, ist in der Regel keine manuelle Eingabe erforderlich.

Die Rekonstruktion erfolgt im degradierten Modus: Stripes, an denen beide ausgefallenen Laufwerke beteiligt waren, lassen sich nicht aus der Parität wiederherstellen; die entsprechenden Dateien werden als nicht zugreifbar markiert. Stripes, an denen nur eines der beiden ausgefallenen Laufwerke beteiligt war, werden aus den verbleibenden Mitgliedsdaten und der Parität rekonstruiert — diese Dateien sind vollständig wiederherstellbar. Das Programm markiert nicht zugreifbare Dateien im Verzeichnisbaum vor dem Kopiervorgang, sodass der Umfang der Datenrettung vor dem Zielpfad bereits ersichtlich ist.

↓

RAID-Constructor — bei beschädigten Superblock-Metadaten

Wenn die automatische Erkennung kein Ergebnis liefert — etwa weil Superblöcke teilweise überschrieben, durch ein Firmware-Ereignis beschädigt oder wegen eines ausgefallenen Laufwerks, das während des Rebuilds teilweise beschrieben wurde, nicht mehr vorhanden sind — wechseln Sie zum RAID-Constructor. In diesem Modus können alle Array-Parameter manuell festgelegt werden, wobei der Superblock vollständig umgangen wird.

Ermitteln Sie zunächst den Dateisystem-Offset mit dem integrierten HEX-Editor. Öffnen Sie jedes Laufwerk oder Image im HEX-Editor und suchen Sie nach dem ASCII-Marker LABLEONE. In SHR- und SHR-2-Konfigurationen markiert diese Zeichenfolge den Beginn des Volume-Datenbereichs. Der Sektor unmittelbar vor dem LABLEONE-Sektor — der mit Nullen gefüllt ist — ist der Offset-Sektor. Notieren Sie dessen Sektornummer: Dieser Wert ist als Parameter Offset im RAID-Constructor einzutragen.

Tragen Sie im RAID-Constructor die folgenden Parameter ein:

Parameter	SHR-1-Wert	SHR-2-Wert
RAID-Typ	RAID 5	RAID 6 / links synchron (P+Q)
Blockgröße	64 KB	64 KB
Bytes pro Sektor	512	512
Laufwerksreihenfolge	Entspricht der ursprünglichen NAS-Schachtreihenfolge — Schacht 1 zuerst
Offset	Sektornummer aus der LABLEONE-Suche (pro Laufwerk)

Wenn die ursprüngliche Laufwerksreihenfolge nicht bekannt ist, bestimmen Sie sie per Test: Fügen Sie die Laufwerke in unterschiedlichen Reihenfolgen zur Liste der ausgewählten Datenträger hinzu und prüfen Sie nach jeder Änderung die rekonstruierte Dateisystemstruktur. Bei korrekter Reihenfolge entsteht eine nachvollziehbare Verzeichnisstruktur; bei falscher Reihenfolge werden unbrauchbare Daten oder ein leerer Baum angezeigt. Der Offset-Wert muss für jedes physische Laufwerk bzw. Image separat festgelegt werden — er kann zwischen den Mitgliedern abweichen, wenn die Laufwerke in der ursprünglichen SHR-Konfiguration unterschiedliche Kapazitäten hatten.

Wenn eines der ausgefallenen Laufwerke überhaupt nicht angeschlossen werden kann — mechanisch defekt, nicht erkannt — verwenden Sie Add empty disk, um an der richtigen Position in der Laufwerksliste einen Platzhalter einzufügen. RS RAID Retrieve behandelt den Platzhalter als vollständig unlesbares Laufwerksmitglied: Datenstreifen, zu denen dieses Laufwerk beigetragen hat, werden aus der Parität mit den verbleibenden Mitgliedern rekonstruiert (dadurch können Daten aus diesen Stripes wiederhergestellt werden), und Stripes, bei denen auch der Paritätsanteil des Platzhalters benötigt wird, werden als nicht wiederherstellbar markiert. Dies entspricht dem maximal möglichen Datenrettungsergebnis bei einer Konfiguration mit einem physisch nicht zugänglichen Laufwerk.

Dateisystem-Scan und selektive Dateiwiederherstellung

Sobald das Array wiederhergestellt ist — automatisch oder über den RAID-Konstruktor — durchsucht RS RAID Retrieve das Btrfs- oder ext4-Dateisystem auf dem logischen Volume. Der Scan durchläuft den Dateisystembaum, identifiziert intakte und beschädigte Bereiche und erstellt eine vollständige Verzeichnisliste. Dateien und Ordner, deren Datenblöcke mit nicht wiederherstellbaren Stripe-Segmenten überlappen, werden bereits vor Beginn des Kopiervorgangs markiert — ein Kopieren nach dem Versuch-und-Irrtum-Prinzip ist nicht erforderlich, um festzustellen, was zugänglich ist.

Wählen Sie die wiederherzustellenden Dateien und Ordner aus, geben Sie ein Ziel auf einem separaten Laufwerk mit ausreichend freiem Speicherplatz an, und starten Sie den Kopiervorgang. Auf Quelllaufwerke und Images wird während des gesamten Vorgangs ausschließlich im Lesemodus zugegriffen. Informationen zur LVM-Ebene zwischen dem mdadm-Array und dem Dateisystem finden Sie in unserem Artikel zur LVM-Struktur und Funktionsweise.

🖥️ 🏥

Stufe 3 Physisches Wiederherstellungslabor — mechanisch beschädigte Laufwerke

Schwierigkeit:

Gering

Die softwaregestützte Datenrettung — auf jeder Ebene — setzt voraus, dass die Lese-/Schreibköpfe des Laufwerks Sektordaten an den Host-Controller liefern können. Ist der Kopfstack mechanisch beschädigt, der Voice-Coil-Aktuator blockiert oder das Spindellager ausgefallen, kann das Laufwerk Leseanforderungen unabhängig von der Softwarekonfiguration nicht bedienen. Ein Datenrettungslabor ersetzt den Kopfstack in einer Reinraumumgebung (ISO-Klasse 5 oder besser), justiert die Kopfposition auf die jeweilige Platter und verwendet Firmware-Tools, um Sektordaten aus Bereichen auszulesen, die die eigene Elektronik des Laufwerks nicht lesen würde.

Das Ergebnis eines Laboreinsatzes ist eine Reihe von Sektor-Image-Dateien — jeweils eine pro Laufwerk. Diese Images enthalten den bestmöglichen Lesezustand jeder Laufwerksoberfläche, einschließlich Sektoren aus physisch beschädigten Bereichen, die unter normalen Bedingungen I/O-Fehler verursachen. Nach dem Erhalt werden diese Images direkt in RS RAID Retrieve verwendet: Der RAID-Konstruktor liest die Superblöcke aus (oder nutzt die Methode mit dem LABLEONE-Offset, wenn die Superblöcke beschädigt sind), rekonstruiert die SHR-Array-Topologie und fährt mit Dateisystem-Scan und Datenwiederherstellung genau wie in Stufe 2 beschrieben fort.

Die Einschränkung bei doppeltem Paritätsausfall gilt für Labor-Images genauso wie für physisch angeschlossene Laufwerke — Stripe-Segmente, an denen beide ausgefallenen Mitglieder beteiligt sind, bleiben mathematisch nicht wiederherstellbar, unabhängig davon, wie sauber die Sektordaten ausgelesen wurden. Der Mehrwert des Labors besteht darin, dass auch Sektoren zugänglich werden, die Software-Tools auf einem live degradierten Laufwerk aufgrund von Lesefehlern nicht erfassen könnten; dadurch kann sich der Anteil wiederherstellbarer Dateien deutlich erhöhen.

Ein umfassenderer Überblick darüber, wann eine professionelle Datenrettung sinnvoll ist und wie der Ablauf aussieht, findet sich in unserem Artikel zur Datenrettung von ausgefallenen Festplatten.

Direkt zu Level 3 wechseln, wenn Sie eines der folgenden Symptome feststellen

Klickende, schleifende oder brummende Geräusche von einem Laufwerk beim Einschalten
Laufwerk wird weder im BIOS/UEFI noch in der Ausgabe von lsblk erkannt
Laufwerk wird erkannt, aber mdadm --examine liefert I/O-Fehler statt Superblock-Daten
Die Oberflächentemperatur des Laufwerks steigt innerhalb weniger Minuten nach dem Anschluss auf unübliche Werte an
Der S.M.A.R.T.-Wert Reallocated Sector Count (ID 05) liegt im dreistelligen Bereich oder der Spin Retry Count (ID C0) steigt bei jedem Einschaltzyklus an

Versuchen Sie bei einem mechanisch defekten Laufwerk keine softwarebasierte Datenrettung. Jeder Lesevorgang erhöht den Verschleiß an bereits beschädigten Schreib-/Leseköpfen und Plattenoberflächen. Schalten Sie das Gerät aus und wenden Sie sich an ein Datenrettungslabor, bevor Sie einen weiteren Zugriff versuchen.

Ein doppelter Ausfall in SHR-1 liegt an der Schnittstelle zwischen softwarebasierter Wiederherstellung und physischer Datenrettung. Wo diese Grenze in Ihrem Fall genau verläuft, hängt vom Zustand der Festplatten ab, nicht von den Möglichkeiten der Tools. Zwei physisch intakte Laufwerke mit intakten Superblöcken eröffnen der Software einen realen Weg zur teilweisen Wiederherstellung. Zwei mechanisch ausgefallene Laufwerke gehören direkt in ein Datenrettungslabor. Die meisten realen Doppelausfälle liegen irgendwo zwischen diesen Extremen – deshalb ist die Bewertung des Laufwerkszustands vor der Wahl des Wiederherstellungswegs hier noch wichtiger als in jedem anderen Szenario dieser Reihe.

Häufig gestellte Fragen

Die Aussage von DSM ist in einem bestimmten Sinne korrekt: Das Array lässt sich mit dem Storage-Manager von DSM nicht in einen vollständig konsistenten Zustand zurückführen. Das bedeutet jedoch nicht, dass einzelne Dateien unwiederbringlich verloren sind. DSM bietet keinen Mechanismus für eine partielle RAID-Rekonstruktion oder für die selektive Extraktion von Dateien aus einem degradierten Volume — es behandelt die Wiederherstellung auf Ebene des Storage-Pools als Alles-oder-Nichts. Software-Werkzeuge wie RS RAID Retrieve arbeiten auf einer niedrigeren Ebene und greifen direkt auf die mdadm-Superblocks sowie die LVM-Metadaten zu, um Dateien aus Datenstripes zu extrahieren, die nicht gleichzeitig von beiden Ausfällen betroffen sind. Bei einem Doppel-Ausfall, bei dem beide Laufwerke physisch lesbar sind, ist eine sinnvolle partielle Wiederherstellung oft möglich, selbst wenn DSM die Situation als nicht wiederherstellbar meldet.

Erstellen Sie zuerst ein Image des Laufwerks. Ein Laufwerk mit fehlerhaften Sektoren verursacht während des Wiederherstellungs-Scans Lesefehler, wodurch Software Sektoren überspringen, die RAID-Stripe-Rekonstruktion fehl ausrichten oder komplett zum Stillstand kommen kann. ddrescue oder die integrierte Image-Funktion von RS RAID Retrieve lesen problematische Sektoren mehrfach aus, extrahieren so viele Daten wie möglich und erzeugen eine vollständige Sektorkarte, die anzeigt, welche Bereiche nicht lesbar sind. Der Wiederherstellungs-Scan läuft anschließend gegen dieses Image — eine statische Datei — statt gegen das sich weiter verschlechternde physische Laufwerk, wodurch verhindert wird, dass das Laufwerk während des stundenlangen Scans weiter ausfällt. Bei einem Laufwerk mit fehlerhaften Sektoren in einem bereits beeinträchtigten RAID ist dieser Unterschied entscheidend.

Beginnen Sie mit neuen Laufwerken und ziehen Sie ein Upgrade auf SHR-2 in Betracht, falls Ihr NAS-Modell dies unterstützt und Sie vier oder mehr Laufwerksschächte haben. Die überlebenden Laufwerke in einem Doppel-Ausfallszenario standen unter anhaltender Belastung — sie liefen eine Zeit lang im degradierten Zustand ohne jegliche Redundanz und wurden dann zusätzlich durch die intensiven Lesezugriffe der Wiederherstellung beansprucht. Die S.M.A.R.T.-Daten geben Auskunft über ihren aktuellen Zustand, doch selbst Laufwerke, die S.M.A.R.T.-Prüfungen bestehen, tragen bereits Verschleiß. Ein neues Array auf derselben Hardware wiederaufzubauen, die gerade einen katastrophalen Ausfall erlebt hat, ist ein Risiko, das nur schwer zu rechtfertigen ist, zumal Festplatten die günstigste Komponente im System sind. Zur Wahl des passenden RAID-Levels für Ihren Anwendungsfall lesen Sie unseren Artikel zu den besten RAID-Konfigurationen für NAS.

Ja — das ist der Standard‑Workflow, wenn physische und logische Wiederherstellung kombiniert werden. Das Labor erstellt sektorgenaue Abbilder (Sektor‑für‑Sektor) jedes Laufwerks und liefert sie als Image‑Dateien. RS RAID Retrieve kann dann genau wie bei physisch angeschlossenen Laufwerken von diesen Abbildern arbeiten: es liest die mdadm‑Superblocks aus den Abbildern, stellt bei Bedarf die SHR‑Array‑Konfiguration im RAID Constructor wieder her, aktiviert die LVM‑Volume‑Gruppe und stellt das Btrfs‑ bzw. ext4‑Dateisystem zur Wiederherstellung bereit. Die Beschränkung durch Parität bei Doppel‑Ausfall bleibt bestehen — Stripes, die beide ausgefallenen Laufwerke betreffen, sind weiterhin nicht rekonstruierbar — alles andere ist zugänglich. Der Vorteil von Labor‑Abbildern ist, dass sie oft Sektoren zurückgewinnen können, die aufgrund von Oberflächenschäden unlesbar waren; dadurch erhöht sich der Anteil rekonstruierbarer Dateien im Vergleich zur direkten Arbeit mit dem beschädigten Laufwerk spürbar.