Update von 17:35 Uhr – Problem gefunden und behoben

Update von 17:35 Uhr

Die Ursache ist gefunden. Die „Autostart bei Absturz Funktion“ ist fehlerhaft. Wir haben diese vorübergehend deaktiviert, bis ein Update zur Verfügung steht.

Um 17:25 Uhr haben wir alle Hostsysteme von Cluster1 – Cluster40 neugestartet, damit alle eventuell doppelt gestarteten Server defintiv gestoppt sind.

Wir hoffen weiterhin auf Euer Verständnis und wünschen ein schönes Wochenende!

Durch diesen Software-Bug sah die Auslastung vieler Hostsysteme heute so aus (Total am Limit des Möglichen):

Wenn dreimal soviele Server wie sonst üblich gestartet sind, ist das auch kein Wunder… bitte entschuldigt die Störung.

Fehler in Update unserer Steuerungsoftware für Linux-Gameserver

Aktuell liegt ein Fehler in unserer Steuerungssoftware für die Linux-Gameserver vor, die heute geupdatet wurde. Dadurch bedingt starten Gameserver mitunter doppelt, wodurch einige Hostsysteme massiv überlastet sind. Heute verbauten wir zuerst in Cluster34 mehr RAM, bemerkten das eigentliche Problem (Die doppelt gestarten Server) erst später. Das Problem betraff alle Linux-Hostsysteme, die Gameserver hosten in unserer Serverfarm.

Davon haben nur Kunden etwas gemerkt, die auf Hostsystemen mit relativ großer aktiver Kundenzahl lagen. Immer wenn ein aktiver Kunde seinen Server startete, startete er ihn 2-3x ungewollt. Dadurch wurden z.B. im Falle von ARK-Gameserver mit einem Start statt 6 GB RAM direkt 18 GB RAM belegt. So eine Mehrbelastung hält keine Serverfarm auf Dauer aus, wodurch es zeitweise zu Überlasten auf einzelnen Hostsystemen kam (darunter auch Cluster34).

Wir arbeiten mit Hochdruck an einem Fix.

Für die Zwischenzeit spielen wir wieder die alte Software-Version ein. Dadurch kommt es pro Hostsystem zu einer Nichterreichbarkeit von 1-3 Minuten.

Das Problem sollte dadurch aber sofort behoben sein.

Wir hoffen auf Euer Verständnis und bitten die Unannehmlichkeiten zu entschuldigen.

Störung auf CLUSTER34

Aktuell liegt eine Störung auf cluster34 vor. Wir arbeiten bereits an der Behebung dieses Problem.

Das System reagiert äußerst träge und die darauf gehosteten Gameserver sind unbenutzbar.

Update: 14:30 Uhr

Wir haben das System mit mehr Arbeitsspeicher bestückt. Statt 256 GB sind jetzt 320 GB Arbeitsspeicher verbaut. Das Problem sollte dadurch gelöst worden sein.

Wir reparieren zusammen Server im Rechenzentrum (Teil 2, Video)

Der zweite Teil unserer neusten Videoserie auf Youtube ist ab sofort online und auf Youtube für Euch verfügbar.

Wir zeigen Euch den Alltag im Rechenzentrum und wie wir mit den ganz alltäglichen Aufgaben im Rechenzentrum für Euch umgehen.

Als Betreiber einer eigenen Serverfarm können wir Euch tiefe Einblicke gewähren.

Viel Hintergrundwissen für alle IT-Fans, direkt aus dem Rechenzentrum:

DRINGE UPDATES für Core-Switches im Rechenzentrum

Heute Abend und morgen früh zwischen 23 und 1 Uhr spielt der Betreiber des Rechenzentrums in Frankfurt auf deren Core Switches ein dringendes Software Update ein, welches ein memory_leak in der Switch Firmware beheben soll. Das memory_leak Problem ist voraussichtlich ursächlich für die kurzzeitigen Netzwerkprobleme der letzten Tage.


Pro Core Switch rechnen wir mit einer Ausfallzeit von ca. 15-30 Minuten. Server / Switche, welche über einen redundanten LACP Channel zum Core Switch verfügen, werden keine Ausfallzeit durch das Softwareupdate erleiden, da das Update Switch für Switch erfolgt.

Terraria-Server Version 1.4 / TMod-Loader 0.11.7 verfügbar

Wir haben unsere Images angepasst und die Terraria-Serverfiles auf die neuste Version 1.4 (Aktuell 1.4.02) geupdatet.

Kunden, deren Server vor gestern bestellt wurden, können durch Klick auf den Update-Button ohne Neuinstallation bequem das Update durchführen.

Ebenso steht nun auch ein Update für den beliebten tMod-Loader bereit, mit dem es Serveradmins möglich wird, Ihren Terraria-Server um Mods zu erweitern. Hier stellen wir die neuste aktuell verfügbare Version 0.11.7 bereit.

Weitere Updates werden natürlich bereitgestellt.

Du hast noch keinen Terraria-Gameserver ?

Dann miete jetzt einen besonders günstig ab 3,19 € / Monat (inklusive Vorauszahlerrabatte) bei uns auf Host-Unlimited.de:

https://host-unlimited.de/gameserver/terraria-server-mieten

Video: Wir reparieren Server im Rechenzentrum

Auch während der Krise sind für Euch in Frankfurt im Rechenzentrum vor Ort und beheben viele Störungen an unserer Serverfarm persönlich.

Wir nehmen Euch in diesem Video mit und lassen Euch uns dabei begleiten, wie so ein ganz normaler Tag im Rechenzentrum ablaufen kann.

In zwei Teilen könnt Ihr Euch das ganze jetzt auf unserem Youtube-Kanal komplett kostenlos ansehen:

Störung auf Cluster30

Nach dem RAM-Upgrade gestern von Cluster30 friert der Host jetzt sporadisch ein. Wir vermuten, dass eines der neuen ECC REG Module defekt ist und prüfen dies gerade. Daher kann es zu weiteren Ausfällen kommen. Wir hoffen auf Euer Verständnis.

Wartungsarbeiten: RAM-Upgrades – 10-20 Minuten Downtime am 04.05.2020

Heute kommt es zwischen 15 und 17 Uhr auf den unten aufgeführten Systemen zu einer Downtime von 10-20 Minuten.

Hintergrund ist, dass wir diese Systeme von 192 GB auf 256 GB RAM upgraden, um damit das Polster für Peakbelastungen zu vergrößern.

In einem Fall wird von 384 auf 512 GB erweitert (vCluster15).

Cluster: 4, 5, 6, 9, 10, 11, 14, 16, 24, 22, 25, 27, 28, 29, 30

vCluster: 15

Wartung abgeschlossen auf VCluster2 und VCluster5

Heute wurden Wartungsarbeiten (Wichtige Softwareupdates installiert) an VCLUSTER2 und VCLUSTER5 durchgeführt. Dadurch mussten einige Neustarts eingeleitet werden, wodurch betroffene Kunden-VMs etwa 5 Minuten nicht benutzbar waren. VCLUSTER2 wurde 2 x neugestartet, weil es zu Problemen kam, VCLUSTER5 1 x.

Die Arbeiten sind nun abgeschlossen. Alle VMs sollten wieder nutzbar sein.