|
1 | 1 | --- |
2 | | -title: "待翻译" |
3 | | -description: "此页面待翻译" |
4 | | -source: "troubleshooting/node.md" |
| 2 | +title: "Knotenfehler" |
| 3 | +description: "Vollständige Schritte zur Behandlung von Knotenfehlern in RustFS-Clustern. Hauptsächlich umfasst: Ersatz-Knoten-Hardware-Vorbereitung, Konfigurationsaktualisierung, Service-Bereitstellung, erneutes Beitreten zum Cluster, Datenheilung sowie nachfolgende Überprüfungen und Best Practices." |
5 | 4 | --- |
6 | 5 |
|
7 | | -# 待翻译 |
| 6 | +# RustFS Knotenfehler-Fehlerbehebungsleitfaden |
8 | 7 |
|
9 | | -此页面内容尚未翻译,请参考[中文版本](../../zh/troubleshooting/node.md)。 |
| 8 | +In verteilten RustFS-Clustern wird ein Erasure Coding-Mechanismus verwendet, um sicherzustellen, dass Lese-/Schreibzugriff auch bei partiellen Knotenfehlern bereitgestellt wird und nach dem erneuten Beitreten des Knotens automatische Datenheilung durchgeführt wird. Dieses Dokument führt Sie durch den folgenden Prozess: |
10 | 9 |
|
11 | | ---- |
| 10 | +1. Ersatz-Knoten starten und Umgebung synchronisieren |
| 11 | +2. DNS/Hostname aktualisieren, damit alte Knoten-Identifikation auf neuen Knoten zeigt |
| 12 | +3. RustFS-Service herunterladen und bereitstellen, der mit dem Cluster konsistent ist |
| 13 | +4. Neuen Knoten erneut zum Cluster hinzufügen und Datenheilung auslösen |
| 14 | +5. Heilungsfortschritt überwachen und nachfolgende Überprüfungen und Optimierungen durchführen |
| 15 | + |
| 16 | +## 1) Ersatz-Knoten starten |
| 17 | + |
| 18 | +* **Hardware- und Systemvorbereitung** |
| 19 | + Stellen Sie sicher, dass die Server-Hardware des Ersatz-Knotens der des fehlerhaften Knotens entspricht, einschließlich CPU, Speicher, Netzwerkkonfiguration und Festplattentyp; selbst bei höherer Konfiguration wird die Cluster-Leistung nicht beeinträchtigt. |
| 20 | + Die Software-Umgebung muss mit anderen Knoten versionskonsistent sein (Betriebssystem, Kernel, Abhängigkeitsbibliotheken usw.), um Cluster-Anomalien aufgrund von Umgebungsunterschieden zu vermeiden. |
| 21 | + |
| 22 | +* **Exklusiver Laufwerkszugriff** |
| 23 | + Wie bei physischen Laufwerken erfordert RustFS exklusiven Zugriff auf Speichervolumes und verbietet es anderen Prozessen oder Skripten, Daten in Speichervolumes direkt zu modifizieren, da dies leicht zu Datenbeschädigung oder Redundanzverlust führen kann. |
| 24 | + |
| 25 | +## 2) Hostname und Netzwerkauflösung aktualisieren |
| 26 | + |
| 27 | +* **DNS/Hosts-Konfiguration** |
| 28 | + Wenn die IP-Adresse des Ersatz-Knotens von der des fehlerhaften Knotens abweicht, muss der Hostname des alten Knotens (z.B. `rustfs-node-2.example.net`) erneut auf den neuen Knoten aufgelöst werden, um sicherzustellen, dass Cluster-Knoten sich über dieselbe Adresse gegenseitig entdecken. |
| 29 | + |
| 30 | + ```bash |
| 31 | + # Beispiel: Zeile in /etc/hosts hinzufügen oder ändern |
| 32 | + 192.168.1.12 rustfs-node-2.example.net |
| 33 | + ``` |
| 34 | + |
| 35 | + Nach korrekter Auflösung können Sie mit `ping` oder `nslookup` überprüfen, dass der Hostname auf den neuen Knoten zeigt. |
| 36 | + |
| 37 | +## 3) RustFS-Service bereitstellen und konfigurieren |
| 38 | + |
| 39 | +* **Download und Installation** |
| 40 | + Folgen Sie dem offiziellen RustFS-Bereitstellungsprozess derselben Version, laden Sie Binärdateien oder Installationspakete herunter, die mit vorhandenen Knoten konsistent sind, und entpacken Sie sie in ein einheitliches Verzeichnis. Stellen Sie sicher, dass Startskripte, Umgebungsvariablen und Konfigurationsdateien (wie `/etc/default/rustfs`) vollständig mit anderen Knoten im Cluster übereinstimmen. |
| 41 | + |
| 42 | +* **Konfigurationsvalidierung** |
| 43 | + |
| 44 | + * Überprüfen Sie, ob die Cluster-Knotenliste (endpoints) in `config.yaml` den Hostname und Port des neuen Knotens enthält. |
| 45 | + * Stellen Sie sicher, dass alle Knoten dieselben Zugriffsschlüssel und Berechtigungskonfigurationen haben, um zu vermeiden, dass der neue Knoten aufgrund von Authentifizierungsfehlern nicht beitreten kann. |
| 46 | + |
| 47 | +## 4) Erneut zum Cluster beitreten und Datenheilung auslösen |
| 48 | + |
| 49 | +* **Service starten** |
| 50 | + Starten Sie den RustFS-Service auf dem neuen Knoten. Der Service sollte automatisch erkannt werden und zum Cluster beitreten, wenn die Konfiguration korrekt ist. |
| 51 | + |
| 52 | +* **Cluster-Status überprüfen** |
| 53 | + ```bash |
| 54 | + # Cluster-Status überprüfen |
| 55 | + rustfs admin info |
| 56 | + |
| 57 | + # Knoten-Status überprüfen |
| 58 | + rustfs admin node status |
| 59 | + ``` |
| 60 | + |
| 61 | +* **Datenheilung auslösen** |
| 62 | + ```bash |
| 63 | + # Heilung für alle Buckets starten |
| 64 | + rustfs admin heal start --all |
| 65 | + |
| 66 | + # Heilungsstatus überwachen |
| 67 | + rustfs admin heal status |
| 68 | + ``` |
| 69 | + |
| 70 | +## 5) Überwachung und nachfolgende Überprüfungen |
| 71 | + |
| 72 | +* **Heilungsfortschritt überwachen** |
| 73 | + ```bash |
| 74 | + # Heilungsfortschritt in Echtzeit überwachen |
| 75 | + watch -n 5 'rustfs admin heal status' |
| 76 | + ``` |
| 77 | + |
| 78 | +* **Cluster-Integrität überprüfen** |
| 79 | + ```bash |
| 80 | + # Detaillierte Cluster-Informationen |
| 81 | + rustfs admin info |
| 82 | + |
| 83 | + # Speicher-Status überprüfen |
| 84 | + rustfs admin storage info |
| 85 | + ``` |
| 86 | + |
| 87 | +* **Systemprotokolle überprüfen** |
| 88 | + ```bash |
| 89 | + # RustFS-Protokolle überwachen |
| 90 | + journalctl -u rustfs -f |
| 91 | + |
| 92 | + # System-Protokolle überprüfen |
| 93 | + dmesg | tail -50 |
| 94 | + ``` |
| 95 | + |
| 96 | +## Häufige Probleme und Lösungen |
| 97 | + |
| 98 | +### Problem: Neuer Knoten kann nicht zum Cluster beitreten |
| 99 | + |
| 100 | +**Lösung**: Überprüfen Sie die Konfiguration: |
| 101 | +```bash |
| 102 | +# Konfigurationsdatei überprüfen |
| 103 | +cat /etc/rustfs/config.yaml |
| 104 | + |
| 105 | +# Netzwerkkonnektivität testen |
| 106 | +ping rustfs-node-1.example.net |
| 107 | +``` |
| 108 | + |
| 109 | +### Problem: Heilung startet nicht |
| 110 | + |
| 111 | +**Lösung**: Manuell Heilung auslösen: |
| 112 | +```bash |
| 113 | +rustfs admin heal start --bucket <bucket-name> |
| 114 | +``` |
| 115 | + |
| 116 | +### Problem: Unerwartete Leistungsprobleme |
| 117 | + |
| 118 | +**Lösung**: Überprüfen Sie die Systemressourcen: |
| 119 | +```bash |
| 120 | +# CPU und Speicher überprüfen |
| 121 | +top |
| 122 | +htop |
| 123 | + |
| 124 | +# Festplatten-I/O überprüfen |
| 125 | +iostat -x 1 |
| 126 | +``` |
| 127 | + |
| 128 | +## Best Practices |
| 129 | + |
| 130 | +1. **Proaktive Überwachung**: Überwachen Sie Knoten-Status regelmäßig |
| 131 | +2. **Backup-Strategien**: Implementieren Sie angemessene Backup-Strategien |
| 132 | +3. **Dokumentation**: Dokumentieren Sie alle Wartungsaktivitäten |
| 133 | +4. **Testumgebung**: Testen Sie Knotenersatz in einer Testumgebung |
| 134 | + |
| 135 | +## Zusammenfassung |
| 136 | + |
| 137 | +RustFS bietet robuste Mechanismen zur Behandlung von Knotenfehlern: |
| 138 | + |
| 139 | +- ✅ **Automatische Heilung**: Daten werden automatisch nach Knotenersatz geheilt |
| 140 | +- ✅ **Kontinuierlicher Betrieb**: Cluster bleibt auch bei Knotenfehlern betriebsbereit |
| 141 | +- ✅ **Einfache Wartung**: Standardisierte Verfahren für Knotenersatz |
| 142 | +- ✅ **Überwachung**: Umfassende Tools zur Überwachung des Heilungsprozesses |
12 | 143 |
|
13 | | -*This page is pending translation. Please refer to the [Chinese version](../../zh/troubleshooting/node.md).* |
| 144 | +Durch Befolgen dieser Schritte können Sie Knotenfehler effektiv beheben und die Cluster-Integrität in Ihrem RustFS-System aufrechterhalten. |
0 commit comments