Sammlung
realer Ausfälle und Störungen
von Kommunikationsnetzen
Revision: 1.45

Martin Kulas   Aaron Kunde

12. November 2007

1  Einführung

Kommunikationsnetze sind allgegenwärtig und wir sind von ihnen abhängig. Wie abhängig wir von ihnen sind, merken wir erst, wenn diese Netze gestört (nicht ihre gewohnte Leitung bringen) oder ausgefallen sind. Es gibt im Internet verstreut Berichte von Ausfällen oder Störungen, aber keine wirkliche Sammlung und Bewertung von wirklich aufgetrenen Problemen, die die Netzwerkzuverlässigkeit betreffen. Daher haben wir uns zur Aufgabe gesetzt, eine Sammlung interessanter Netzausfälle und -störung zu erstellen.

2  Motivation

Im Oktober 2006 ist die Internetanbindung unseres Informatik-Fachbereiches mehrere Tage lang zum Erliegen gekommen – das erste mal seit über zehn Jahren. Die Tatsache, dass wir Internetzugang am Fachbereich Informatik haben, hat als Selbstverständlichkeit gegolten, so dass der Ausfall überraschend gekommen ist. Das ist der Anstoss gewesen, dass wir uns mit dem Thema der Zuverlässigkeit von Rechnernetzen beschäftigen. Zunächst haben wir uns Ausfälle und Störungen von Kommunikationsnetzen in der Vergangenheit angesehen; genauer: wir haben nach diesen gesucht. Dabei haben wir die Erfahrung gemacht, dass bisher keine Sammlungen von Ausarbeitungen zu Netzausfällen/-störungen existieren.

Im Internet sind wir auf einige “Sammlungen” gestossen, wo reale Netzprobleme festgehalten werden:

Mit dieser Ausarbeitung erhoffen wir uns, eine Überblick über reale Probleme der Netzzuverlässikeit zu geben. Diese Sammlung soll dem Leser das Spektrum von Zuverlässigkeitsproblemen von Kommunikationnetzen zeigen.

3  Vorgehen

Neben der Internetrecherche haben wir einige universitäre Rechenzentren zum Thema Zuverlässigkeit ihrer Rechnernetze kontaktiert. Dabei haben wir die Erfahrung gemacht, dass viele Rechenzentren nicht gerne über dieses Thema reden und auch sonst nicht viel Informationen an “Fremde” über ihre Rechnernetzstruktur preisgeben möchten.

Die meisten Netzausfälle/-störungen von Kommunikationsnetzten mit ihren Ursachen und Auswirkungen haben wir durch Recherchen im Internet gefunden und ausgearbeitet. Unsere Ergebnisse unserer Suche von Ausfällen und Störungen stellen wir hier vor. Dabei versuchen wir auch Massnahmen vorzuschlagen, wie man diesen Netzausfall besser “überlebt” hätte. Im nachhinhein kann man zwar immer leicht sagen, wie man einem bestimmten Zuverlässigkeitsproblem hätte vorbeugen können. Doch im Vorfeld eines Ausfalls/Störung übersieht man die Faktoren, die die Zuverlässigkeit von Netzen gefährden.

4  Die Ausfälle und die Störungen

Um einen groben Überblick über die von uns ausgesuchten Ausfälle und Störungen haben wir Tabelle 1 aufgestellt. Die Spalten der Tabelle haben dabei folgende Bedeutung:

Angeführt haben wir keine Spalten, die die Kosten des Ausfalles/der Störung oder die Anzahl der betroffenen Personen angeben. Denn es ist sehr schwierig, Zahlen dafür zu bekommen. Wenn wir diese Zahlen aber kennen, haben wir diese in den Ausarbeitungungen zu den einzelnen Fällen mitangebenen. Die genauere Betrachtung der einzelnen Fälle geschieht in den folgenden Abschnitten.


KurzbeschreibungDatumDauerRegionUrsache
Kamerun31.10.2007 Kamerun 
NTT15.05.20077 StundenOst-JapanSW
Internet201.05.20074 StundenNew York/BostonMensch
Estland28.04.20072 WochenEstlandMensch
BlackBerry17.04.200711 StundenUSASW
T-V-H25.03.20073 MonateVietnamMensch
google.de23.01.2007< 1 TagDeutschlandMensch
Mailservice bei 1&115.01.2007mehrere StundenErdeHW
Erdbeben in Asien27.12.2006ca. 5 WochenChina, Taiwan, SüdkoreaNatur
Island Kabelbruch17.12.2006mehrere WochenIslandNatur
Informatikum Stellingen11.10.20062.5 TageInformatik Uni HamburgMensch
W3A-Ausfall09.10.2006mehrere StundenEuropa, Nordafrika, Mittlerer Ostenunklar
DNS .ES30.08.2006zwei StundenSpanienMensch
Arcor München03.08.2006mehrere StundenMünchner RaumNatur/HW
Thailand GSM18.05.2006mehrere StundenThailandMensch
all-ink.com 22.10.2005mehrere StundenErdeHW
DE-CIX17.10.20051 StundeDeutschlandSW
Level 321.10.2005ca. 3 StundenUSA, EuropaSW/Mensch
Westösterreich23.08.2005mehrere TageWestösterreichNatur
Google DNS07.05.200515 MinutenErdeSW
Schweiz DSL14.04.2005mehrere StundenSchweizunklar
Intelsat804 14.01.2005TotalaufallSüdpazifik, SüdpolHW
Intelsat Americas 728.11.2004TotalausfallNord-, MittelamerikaHW
Mittelhessen Telefon10.11.200419 StundenMittelhessenSW
isp-service24.08.2004mehrere StundenDeutschlandHW
T-Mobile27.02.20044.5 StundenMVP und NordbrandenburgSW
UK Internet traffic25.11.200315 StundenAmerika, EuropaHW
E-Plus27.10.2000mehrere StundenDeutschlandSW
Strato22.12.19996 StundenDeutschlandMensch
T-Online22.10.1997mehrere StundenDeutschlandSW
Internet DNS17.07.19974 StundenErdeMensch
AOL 08.08.1996mehrere StundenErdeSW
Ausfall Vermittlungsrechner17.09.19914 StundenNew Yorkunklar
Programmkorrekturversuch27.06.1991mehrere StundenUSASW
Kabelunterbrechung NJ04.01.19912 TageNew JerseyMensch
Störung AT&T15.01.19909 StundenUSASW
ARPANET12.12.198611 StundenUSAunklar
Tabelle 1: Übersicht der Netzausfälle und -störungen dieser Sammlung

4.1  Kamerun ohne Internetzugang (31.10.2007)

TODO


Abbildung 1: Netzaufbau von SAFE-SAT3-WASC. Quelle: [6]

4.2  Kein Zugang zum Internet bei NTT (15.05.2007)

NTT (Nippon Telegraph and Telephone) ist ein Unternehmen, welches in Japan den Telekommunikationsmarkt beherrscht. Zudem ist NTT ein Tier-1-Carrier: es peert mit anderen Tier-1-Carriern, und kleinere Carrier bezahlen NTT dafür, damit sie ihre Daten durch NTTs Netz schicken können. Weil NTT eine monopolartige Marktmacht gehabt hatte, wurde es in drei Tochterfirmen im Jahre 1998 aufgeteil: NTT East, NTT West and NTT Telecommunication. Per Gesetz sollen NTT East and NTT West nur Telekommunikationsdienste auf kurzer Distanz anbieten dürfen, also u.a. Internetzugang für Endkunden; für globale Kommunikation ist die Tochter NTT Telecommunication verantwortlich. Der hier geschilderte Ausfall betrifft NTT East.

Am 15.05.2007 um 18:44 Ortszeit konnten Nutzer von NTTs Breitband-Internetanschlüssen in Ostjapan sich nicht mehr ins Internet verbinden[7]. Um 1:35 des Folgetages konnten auch die letzten Kunden wieder eine Internet-Anbindung erhalten. Der Grund für den Ausfall lag an den verwendeten Routern der Firma Cisco [8]: zwischen 2000 und 4000 Router waren am Ausfall beteiligt. Angeblich soll der Ausfall mit einem Umstellen auf unterstützende Routen angefangen haben, wobei die Routing-Tabellen umgeschrieben worden sind. Dieses Schreiben auf die Routing-Tabellen führte dazu, dass die Routing-Tabellen so überfüllt worden sind, dass die Router keine Pakete mehr weitergeleitet haben: Das Netz stand also still. An dem exakten Grund für den Ausfall wird noch von NTT and Cisco geforscht. Cisco wollte nicht sagen, welche spezifischen Router-Modelle am Ausfall beteiligt waren.

In 14 von 17 Bezirken von NTT East hat dieser Ausfall Folgen gehabt. Das bedeutet, dass ingesamt 2.86 Millionen Kunden dadurch ihren Internetzugang verloren haben: Von diesen waren 1.2 Millionen per Glasfaser angebunden, 1.5 Millionen per ADSL und 160.000 per ISDN. Insgesamt hat Japan ca. 14 Millionen DSL-Anschlüsse [9] – 10 Prozent von Japans DSL-Anschlüsse sind nicht nutzbar gewesen. Japans Hauptstadt Tokio, auch im Versorgungsgebiet von NTT East, ist aber nicht betroffen gewesen. Auch der IP-Telephonie-Dienst ist ausgefallen. Von seinen Kunden erhielt NTT East 11.300 Anrufe zu diesem Ausfall.

Dieser Ausfall war der grösste seit Jahren in Japan und geschah an einem Dienstag an einem frühem Abend. Man darf annehmen, dass zu diesem Zeitpunkt viele Japaner ihren Breitband-Internetzugang in der betroffenen Region benutzen wollten, doch für knapp 7 Stunden war es nicht möglich.

Dieser Ausfall kann für NTT bedeuten, dass diese auf Ciscos neuen Router “CRS-1” umsteigen werden, in der Hoffnung, dass diese neuen Router keinen solchen Ausfall erzeugen werden. Die Tatsache, dass NTT East eine homogene Router-Familie (nämlich von nur Cisco) einsetzt, ist beängstigend: wenn ein Router einen Bug hat, dann haben ihn alle anderen wahrscheinlich auch. Router von mehreren Herstellern wären hier wohl hilfreich. Das es auch andere Routerhersteller gibt, zeigt NTT West: hier werden Router vom Hersteller Juniper benutzt, aber auch hier findet sich eine homogene Router-Familie.

Internetnutzer, die auf einen Internetzugang angewiesen sind, hätten diesen Ausfall überlebt, wenn sie einen anderen zweiten Provider zur Verfügung gehabt hätten. Dieser Provider müsste aber vom Netz von NTT East unabhängig sein.

4.3  Streckenausfall beim Internet2 (01.05.2007)

“Internet2” ist ein Zusammenschluss von über 200 US-amerikanischen Universitäten und vielen Firmen. Diese unterhalten ein Hochleistungsnetz auf Glasfaserbasis von mindestens 10 Gbit/s: dieses hat den Namen “Abilene”. “Abilene” soll eine schnelleres Netz als das bisherige Internet sein und als Testplatform für neue fortgeschrittenere Netzanwendungen dienen. Abbildung 2 zeigt die Struktur von Abilene.


Abbildung 2: Netzaufbau von Abilene; (c) 2007 Internet2; Quelle: [14]

Am Dienstag Abend ca 20:20 Uhr Ortszeit gab es eine Unterbrechung der Verbindung zwischen Bosten und New York. Grund war laut [10] und [11] ein Obdachloser an der Longfellow-Brücke in Boston: dieser hat seine Zigarette auf eine Matratze geworfen, die einen Brand auslöste, welcher sogar zur Sperrung der Brücke führte. An dieser Brücke führte auch ein Glasfaserkabel vom Internet2 vorbei. Dieses wurde durch den Brand geschädigt, so dass die Abilene-Verbindung zwischen Bosten und New York nicht mehr bestand. Der Netzbetreiber Level 3 Communication hatte zunächst vorgehabt, die Kommunikation zwischen den Punkten Boston und New York über andere Glasfaserverbindungen zu leiten ([12]). Level 3 hat es geschaft, diese Leitung nach nur vier Stunden zu reparieren ([13]).

Durch diesen Streckenausfall war der Knoten New York nur noch über den Knotenpunkt Washington D.C. erreichbar. New York hat also zu diesem Zeitpunkt über keine Redundanz mehr verfügt. Der Netzwerkverkehr konnte aber umgeleitet werden, da jeder Knoten über mindestens zwei Verbindungen verfügt hat. Zu einem Ausfall des Abilene-Netzwerkes ist es nicht gekommen.

Dieser Ausfall hat nur eine Abiliene-Verbindung zwischen zwei Knoten betroffen. Da jeder Knoten mit mindestens zwei verschiedene Knoten über unterschiedliche Leitungen verbunden ist, ist ein Ausfall einer Leitung nicht weiter kritisch. Schlecht wäre es gewesen, wenn z.B. New Yorks einzige Verbindung zum Abilene-Netz über das Glasfaserkabel zu Bosten gewesen wäre, also eine Stichleitung wäre. Dann würde eine Kabelbeschädigung dazu führen, dass der Knoten New York von den restlichen Knoten des Abilene-Netzes abgeschnitten ist und nicht mehr mit ihnen kommunizieren kann.

4.4  Estland unter DDoS-Attacken (28.05.2007)

Estland hat ca. 1.3 Millionen Einwohner, eine ausgebaute IT-Infrastruktur und setzt stark auf das Internet. E-Government ist in Estland am stärksten von allen Ländern in der EU fortgeschritten, wobei via Internet sogar Wahlen für das Parlament ausgeführt werden [15].

DoS (Denial of Service) - Attacken zielen darauf hin ab, Rechner-Dienste in einem Datennetz für andere Benutzer unbenutzbar zu machen. Dies wird dadurch erreicht, dass der betroffene Dienst so stark mit Anfragen “bombardiert” wird, dass er den regulären Anfragen nicht mehr nachkommen kann. Bei DDoS-Attacken (Distributed DoS) wird ein DoS-Angriff von mehreren Rechnern gefahren. DDoS-Angriffe können auch von Bot-Netzen ausgeführt werden. Ein Bot-Netz ist eine Gruppe von Rechnern, die quasi “Zombies” sind: Diese hören auf ein gemeinsames Kommando und lassen sich aus der Ferne steuern. Meistens wissen die Benutzer von Computern gar nicht, dass ihre Maschinen Zombies und Teil eines Bot-Netzes sind.

Seit dem Vormittag des 28.04.2007 waren die Internetpräsenzen der estnischen Regierung und des Aussenministeriums nicht mehr erreichbar [16]. DDoS-Angriffe legten diese Dienste lahm. Die Ausgangspunkte der Angriffe waren weltweit zerstreut. Die Angriffe hatten eine Datenrate von 10 bis 95 MBit/s. Der grösste Teil der Angriffe verbrauchten eine Daterate von 10 bis 30 MBit/s. 75 Prozent aller Angriffe dauerten weniger als eine Stunde und nur ca. fünf Prozent hielten länger als zehn Stunden an. Insgesamt gab es 128 einzelne Angriffswellen: davon waren 115 ICMP-Angriffe, vier Angriffe belasteten mit TCP-SYN-Packeten die Dienste, und der Rest war allgemeine Angriffe, bei denen Netzlast generiert wurde. Es war ein Angriff von weltweiten Bot-Netzen [17]. Auslöser dieses DDoS-Angriffs war die Verlegung eines sowjetischen Kriegsdenkmals, das Mitten in Estlands Hauptstadt Tallinn stand, in einen Nachbarort zwei Tage davor. Dieses Kriegsdenkmal befindet sich in einem Gräberfeld von sowjetischen Soldaten der Roten Armee, die im Zweiten Weltkrieg gefallen sind. Bei der Verlegung mussten auch die Gräber geöffnet, damit man an die sterblichen Überreste der Soldaten zu gelangen konnte, welche ebenfalls verlegt werden sollten. Durch diese Verlegung versuchte Estland einen besseren Schutz der Totenruhe erreichen. Doch viele Esten sahen in diesem Denkmal auch ein Symbol der Sowjetischen Besetzung. Die russische Minderheit in Estland war empört gegen eine solche Verlegung [18]. Russische Nationalisten haben dann diese DDoS-Angriffe initiiert und fuhren diese mit Unterbrechungen zwei Wochen lang.

Benutzer aus dem Ausland konnten viele estnische Websiten nicht mehr aufrufen, da ihre Website-Anfrage in Estland blockiert wurden, da man nicht festestellen kann, ob diese Anfrage zu den DDoS-Angriffen zählte oder doch nicht. Auch estnische Banken sind Opfer der DoS-Attacke geworden [19].

Estland beschuldigte Russland zunächst hinter den DoS-Angriffen zu stecken, da die Angriffspakete Quell-IP-Adressen aus dem Kreml verwendeten [20]. Russland bestritt eine Beteiligung mit der Begründung, dass die Quell-IP-Adressen gefälscht worden waren, um Russlands Regierung verantwortlich zu machen. Estland bezeichnete diese DoS-Attacken als Cyberterrorismus. Im Nachhinhein stellte sich aber heraus, dass russische Behörden nicht hinter dieser Attacke steckten [21]. Im Verlauf dieser DoS-Attacke fiel immer wieder der Begriff des “Cyper-Kriegs” [22]: Mit Estland ist zum ersten Mal ein unabhängiger Staat ein Opfer eines DDoS-Angriffs geworden. Bisher waren mit DoS-Attacken nur einzelne (vor allem kommerzielle) Websiten betroffen gewesen. Die estnische Regierung verglich diese Form eines Cyper-Krieg mit der Blockade von Häfen oder Flughäfen in herkömmlichen Kriegen. Der Direktor des U.S.-CERT bewertete diesen Angriff als nicht so schlimm wie es estnische Regierung sah. Für diesen Vorfall passte eher der Begriff “Cyper-Krawalle”. Der Vorfall wurde sogar auf die EU- und NATO-Ebene gehoben. Die NATO sieht Cyberangriffe nicht als militärischen Angriff an. Es bestand daher keine Verpflichtung der NATO-Partner zu einer gemeinsamen Verteidigung. Doch es wurde darüber nachgedacht, ob eine Cyber-Attacke einen Bündnisfall in Zukunft ausrufen könnte [23].

Mit dieser massiven Netzstörung wollten die Angreifer ihr Missfallen über eine Denkmalsverlegung zeigen. Viele Regierungsseiten mit Diensten für die estnische Bevölkerung waren nicht benutzbar. Die Netzinfrastruktur blieb unbeschädigt. Es gab auch keine Erpressungsversuche, wie es sonst in der Vergangenheit üblich bei DDoS-Angriffen gegen kommerzielle Internetseiten-Betreiber der Fall war.

Es ist schwierig sich gegen DDoS-Angriffen zu schützen: Firewall/Paketfilter können nicht reguläre Pakete von “bösen” unterscheiden. Ein Paketfilter kann jedoch für den Dienste-anbietenden Rechner eingehende TCP-Verbindungen (SYN-Requests) abfangen. Dieser Paketfilter dient dann als Proxy und leitet eine Anfrage an den adressierten Rechner nur weiter, wenn es sich herausgestellt hat, dass diese eine reguläre Anfrage ist, d.h. der Proxy übernimmt bei TCP das Handshake-Verfahren beim Verbindungsaufbau. Dieses Verhalten realisert z.B. OpenBSDs Paketfilter pf [24].

Einen DDoS-Angriff kann man überleben, indem man “viel” Rechnerkapazitäten und eine “grosse” Datenrate für die Anbindungen zum Internet bereitstellt. Die Attribute “viel” und “gross” sind relativ zum Angriff zu sehen. Wenn eigene Dienste Anbindungen mit höherer Datenrate als die DDoS-Angreifer und ausreichende Rechenkapazitäten haben, dann kann der DDoS-Angriff ausgehalten werden.

Um festzustellen, wer die Verantwortlichen hinter den DDoS-Angriffen sind, wird ein Mechanismus gebraucht, um die Quelle der IP-Pakete zurückverfolgen zu können. Da die Quell-Adressen gefälscht werden können, kann man diese nicht verwenden, um auf den Angreifer zu schliessen. Für IPv6 gibt es Vorschläge, wie man IP-Pakete zurückverfolgen kann [25].

4.5  Ausfall bei BlackBerry (17.04.2007)

Die kanadische Firma RIM (Research in Motion) betreibt einen E-Mail-Push-Dienst mit dem Namen BlackBerry. Ca. acht Millionen Teilnehmer erhalten auf ihr Mobilfunkgerät (BlackBerry genannt) automatisch Benachrichtigungen, dass neue E-Mails für sie angekommen sind. Die Benutzer müssen daher nicht immer nachschauen, ob neue Emails für sie vorliegen. Das ist praktisch. Zudem kann ein Teilnehmer mit seinem BlackBerry auch Emails verfassen und versenden. RIM geniesst hohes Ansehen, was die Zuverlässigkeit seines Dienstes betrifft. Zu RIMs Kunden zählen Firmen im Finanz-, Technologie- und Logistikunternehmen. RIM unterhält zwei sogenannte “Network Operation Centers” (NOC), die im Prinzip grosse Rechenzentren sind. Eines davon befindet sich in Kanada, welches Amerika und Asia abgedeckt, und eines in Großbritannien für Europa, Afrika und den Mittleren Osten. Von den NOCs wird die E-Mail auf das BlackBerry-Gerät des Nutzer übertragen. Zwischen den beiden NOCs können auch E-Mails weitergeleitet werden.

Am Dienstag, dem 17. April 2007, ist dieser Dienst um 20:00 (EDT) ausgefallen. Um 7:00 (EDT) des Folgetages ist dieser Ausfall behoben worden [26]. Betroffen sind die Benutzer in den USA gewesen. Der offizielle Grund für diesen Ausfall ist laut RIM gewesen, dass man “eine neue Systemroutine ins System eingebaut hat, die den Systemcache besser optimieren sollte” [27]. Dabei hat RIM angenommen, dass diese Systemroutine die reguläre Arbeit der Blackberry-Server nicht beeinträchtigt. Als RIM die Folgen dieser neuen Systemroutine beheben wollte, hat RIM auch ihr Backup-System aktiviert, doch dieses hat versagt. Da die meisten betroffenen BlackBerry-Teilnehmer in den USA gewesen sind, nimmt man an, dass dieses Problem im NOC in Kanada stattgefunden hat.

Als Folge dieses Ausfalles konnten Millionen von BlackBerry-Benutzer in der USA keine E-Mails auf ihren BlackBerries mehr empfangen. Glück im Unglück hat RIM gehabt, weil dieser Ausfall an einem Abend begonnen hat, also zu einem Zeitpunkt wo das geschäftliche Treiben nicht zu gross ist. Schlimmer wäre ein Ausfall am Morgen oder zur Mittagszeit gewesen.

RIM hat im BlackBerry-System eine Zuverlässigkeitsschwachstelle: es betreibt nämlich nur zwei NOCs. Diese NOCs sind die grossen Schwachpunkte (Single Points of Failures) in RIMs Netz. Bei einem Fehler in einem dieser NOCs ist gleich eine grosse Region betroffen. Obwohl RIM in den NOCs jeweils ein Backup-System betrieben hat, konnte auch das angeworfene Zweitsystem RIM nicht über den Ausfall helfen. Da RIM in kurzer Zeit viele neue Kunden gewonnen hat, müssen ihre NOCs mehr Rechenleistung aufbringen und Modernisierungen erfahren. Bei dem Aufrüsten der NOCs können dann Fehler geschehen [28]. Damit RIM in der Zukunft massiven Netzausfällen besser vorbeugen kann, könnte RIM entweder die Anzahl der NOCs erhöhen, oder ein funktionierendes Reserve-System einführen.

4.6  Segmente des Seekabelsystems T-V-H gestohlen (25.03.2007)

T-V-H ist ein Unterseekabel-System, welches im Südchinesischen Meer liegt. Auf seiner Länge von 3.367 Kilometer befinden sich 26 Repeater im Abstand von jeweils ca. 138 Kilometer. Dieses System hat drei Endstationen auf dem Lande: in Thailand, Vietnam und Hong Kong; daher auch der Name T-V-H [29]. Es wurde zwischen 1993 und 1995 gebaut, überträgt Datenpakete mit einer Datenrate von 560 Mbit/s und ermöglicht damit Telephonie und schnelle Datenübertragung. Über die Unterseekabel-Systeme T-V-H und SE-ME-WE3 gehen ca. 83 Prozent der vietnamesischen Telefon- und Internetverbindungen hindurch; der Rest der Telekommunikation geschieht über drei Landkabel und einem Satellitensystem. T-V-H hat von Vietnam aus zwei Abzweigungen: eines nach Thailand und eines nach Hong Kong. [30] Ein Teil des Kabelsystems liegt liegt nahe der Küste an der vietnamesischen Provinz Ca Mau.

Seit dem 25. März 2007 ist keine Datenübertragung über ein Unterseekabel zwischen Thailand and Vietnam mehr möglich. Der Grund für den Ausfall liegt darin, dass über 11 (elf) Kilometer dieses Kabels wegen Diebstahls fehlen [31]. Das Kabel nach Thailand ist von den Diebstählen betroffen: Diebe haben dieses Kabel wahrscheinlich mit Tauchern herausgeholt, um die Kabelsegemente an Schrotthändler zuverkaufen. Das Gewässer vor Ca Mau ist nicht sehr tief: nur bis ca. 200 Meter. Die Schrotthändler werden sich wohl mehr für die Ummantelung als das Glasfaser interessieren. Bis Ende Mai hat sich der Ausfall auf 98 Kilometer ausgeweitet. [32, 33] Die Polizisten in Vietnam haben mehrere Schiffe gefunden die zusammen knapp 100 Tonnen Glasfaserkabel transportiert haben.

Die vietnamesischen Telefon- und Datenübertragungsverbindungen werden vorläufig über ein anderes Unterseekabel (SE-ME-WE3) in Da Nang übertragen. Falls auch SE-ME-WE3 von Dieben beschädigt wird, wäre Vietnam mit seinen ca. 85 Millionen Einwohnern (Stand 2005) beinahe komplett kommunikationstechnisch von der Aussenwelt abgeschnitten. Davor fürchten sich die Verantwortlichen in Vietnam: Aus diesem Grund soll die vietnamesische Marine die Seekabel überwachen [34]. Vietnam hat schon länger mit Glasfaser-Dieben zu tun: In Jahre 2007 hat die Polizei ingesamt schon 500 Tonnen Glasfaserkabel beschlagnahmt.

Vietnam hat einen Anschluss an das Unterseekabelsystem SE-ME-WE3 zur Kommunikation, welches genug Kapazitäten besitzt, Vietnams Kommunikationsverkehr zu tragen. Damit ist SE-ME-WE3 für Vietnam von grosser Bedeutung. Aber auch SE-ME-WE3 ist nicht unausfallbar: im Dezember 2006 kam es durch eine Unterseebeben zu einem Ausfall von SE-ME-WE3 [40].

Die Kosten für die Reparatur des Schaden betragen ca. zwei Millionen Euro, wobei Reparatur vermutlich drei Monate dauern wird. Durch die Störung des Kabel kam es auch zu wirtschaftlichen Verlusten, nämlich ca. 4 Millionen USD [35].

Um nicht von wenigen Kabelsystemen abhängig zu sein, sollte Vietnam auch hier Redundanz besitzen, d.h. ein weiteres Kabelsystem sollte gebaut werden. AAG (Asia-America-Gateway)-Unterseekabel ist in Planung: dieses soll durch viele asiatische Länder gehen, ca. 20.000 km lang werden und direkt die USA erreichen. Die Datenrate soll am Anfang 480 Gbit/s betragen. Der Betrieb von AAG ist im Dezember 2008 angesetzt [36].

Um die Probleme mit den Unterseekabeldieben zu beheben, könnte Vietnam zudem mehr Kabelsysteme auf dem Land einrichten. Doch auch hier besteht das Problem, dass Diebe die Erde aufreissen könnten, um an das Kabel zu gelangen. Mit einer weiteren Anbindung zu einem weiteren Satellitensystem könnte Vietnam ihr Problem mit den Kabeldieben auch lösen; doch diese Lösung ist wohl die teuerste und nur für den Notfall zu benutzen, da es schwer vorstellbar ist, den gesamten vietnamesischen Kommunikationsverkehr über Satellit laufen zu lassen.

4.7  Google.de in fremder Hand (23.01.2007)

„Goneo“ ist ein Webhoster, bei dem man sich Domains regsitrieren lassen kann. Sollte man vorher schon einen anderen Provider haben und seine dort registrierten Domains bei einem Wechsel zu „Goneo“ behalten wollen, so muss man einen sogenannten KK-Antrag (Konnenktivitäts-Koordinierungs-Antrag) ausfüllen. Dies kann auch online und somit automatisiert geschehen. Anschließend wird die Anfrage an die zuständige Registrierungsstelle weitergeleitet. Für eine Domain mit der Endung „.de' also das „DeNIC“. Dieses ist die zentrale Registrierungsinstanz für Domains mit der Endung „.de“. Diese fragt dann den vorherigen Provider der entsprechenden Domain, ob der Wechsel stattfinden darf. Sollte sich dieser innerhalb einer bestimmten Zeitspanne keinen Einwand erheben, so wird der Wechsel vollzogen.

Am Dienstag morgen, den 23.01.2007, so Heise.de (siehe [37] und [38]) war unter der URL www.google.de nicht mehr die gewohnte Suchmaschine anzutreffen, sondern eine andere Seite. Diese Seite gehörte einem Kunden des Webhosters „Goneo“. Der Kunde hat wohl einen Online-KK-Antrag ausgefüllt, in dem er behauptet hat, Eigentümer der Domain „google.de“ zu sein. Dieser KK-Antrag wurde also gestellt, ohne dass von der Geschäftsführung von „Goneo“ geprüft wurde, ob der Kunde wirklich Eigentümer der Domain „google.de“ war. Die Anfrage wurde also an das „DeNIC“ weitergeleitet, welche wiederum eine Anfrage an den Provider der Domain „google.de“ stellte. Allerdings gab es keine Antwort in der vorgesehenen Zeitspanne. Somit wurde eine Bestätigung angenommen. Es scheint, dass der Provider von „google.de“ nicht bei der amerikanischen „Google Inc.“ nachgefragt hatte. Allerdings gab es wohl keinerlei Bestätigungen seitens „Google“.

Auf jeden Fall wurde somit durch mangelnde Überprüfung die Domain „google.de“ an den Kunden übergeben und Die Suchmaschine war unter www.google.de nicht mehr anzutreffen.

Um diesem in Zukunft entgegenzuwirken, hat sich die Geschäftleitung von „Goneo“ dazu entschlossen, in Zukunft eine Überprüfung vorzunehmen.

4.8  Störung des Mailservice vom Webhoster 1&1 (15.01.2007)

Wie Heise.de meldete [39] war das Abholen von Emails beim Webhoster 1&1 nur mit grossen Verzögerungen möglich. Der Grund für diese Verzögerungen lag in dem Ausfall eines RAID-System im Mailspeichersystem. Laut Angaben von 1&1 gingen aber keine Emails verloren. Folgen dieses Netzdienstausfalles waren, dass viele Kunden von 1&1 mehrere Stunden lang nicht ihre Emails abholen konnten und darüber sehr verärgert waren.

Man kann davon ausgehen, dass sich einige Kunden einen neuen Webhoster gesucht haben, in der Hoffnung, dass dort nicht ein Ausfall, wie in diesem Ausmass auftretten wird. Eigentlich soll ein RAID-System den Ausfall von Festplatten vermeiden. Hier scheint aber das RAID-System selbst Ursache eines Ausfalls gewesen zu sein und nicht die angehängten Festplatten.

Um so einen Ausfall in Zukunft zu verhindern, könnte der Webhoster zwei RAID-Festplattensysteme gleichzeitig betrieben, wobei das eine RAID-System nur eine Kopie des Inhaltes des primären ist. Beim Ausfall des primären RAID-Systemes springt dann dieses sekundäre RAID-System ein und übernimmt die Rolle des primären RAID-Systems. So haben die Techniker von 1&1 die Möglichkeit, dass primäre System zu reparieren, ohne dass die Kunden einen Service-Ausfall beklagen müssen.

4.9  Internet in Asien wegen Erdbebenschäden verlangsamt (27.12.2006)

Wie in [44] nachzulesen ist ist das „SEA-ME-WE3“ ein Projekt, welches 33 Länder aus den 4 Kontinenten Europa, Afrika, Asien und Australien miteinander verbindet. Die Verbindung kann auf der Karte 3 die aus der Quelle [45] stammt, eingesehen werden. Die Verbindung besteht über Unterseekabel. Nach eigenen Angaben, ist dies mit 39.000km die längste Verbindung der Welt „Sea-Me-We 3 is the longest system in the world with a total length of 39,000 km.“ ([44]).

Wie Heise.de in [40] berichtete, führte ein Erdbeben, welches am Dienstag, den 26.12.2006 mit einer Stärke von 6,7 auf der Richterskala erreichte, zu Beschädigungen an einige Unterwasserkabeln. Die Internetanbieter, die diese Verbindung nutzten aktivierten ihre Notfallsysteme.

Trotz der Notfallmaßnahmen konnte der Ausfall nicht kompensiert werden. Dies führte zu erheblichen Verlangsamungen des Internetverkehrs für mehr als 100 Mio. Benutzer in den Ländern China, Taiwan, Singapur und Südkorea. Die Ortung des Problems dauerte 24 Stunden. Nach einem Sprecher der taiwanesischen Chunghwa Telecom wurde für die benötigte Dauer der Reperatur 2-3 Wochen veranschlagt. Auch einen Tag später war die Situation noch nicht besser. Laut [41] lag die Verlässlichkeit und die Geschwindigkeit unter der Hälfte des Weltdurchschnitts. Dies hatte laut dem Internetportal „sina.com“ zur Folge, dass 97% der Benutzer Probleme hatten ausländische Webseiten aufzurufen und 57% der Benutzer ihr Leben oder ihre Arbeit beeinträchtigt sahen. Auch am 16.01.2007 war die Internet-Verbindung noch eingeschränkt, wie [43] zu entnehmen ist. So wurden ausländische Internetseiten nur langsam aufgebaut und eMails mit größeren Anhängen (wobei hier keine genaueren Angaben gemacht wurden) gingen verloren. Erst am 05.02.2007 kam auf Heise.de die Nachricht, dass das Problem behoben wurde und sich der Internetverkehr normalisiert hat. [46] zu Folge waren zu diesem Zeitpunkt VoIP und Downloads aus Europa mit einer Datenrate von 10KBit/s möglich.

Nach 24 Stunden wurde der Fehler entdeckt, wobei nicht klar ist, ob er da auch schon lokalisiert war. Davon ist allerdings im Normalfall auszugehen. Es wurden 5 Kabelschiffe zur Reparatur geschickt. Von diesen waren zwei schon zwei Tage später unterwegs. Wann die volle Mannschaft anwesend war, ist fraglich. Auch gab es technische Schwierigkeiten. So lagen die Kabel in einer Tiefe von 4000m. Dies bedeutet, es konnten keine elektrischen Geräte oder Roboter eingesetzt werden. Zudem wurde die Mannschaft zusätzlich durch stürmisches Wetter aufgehalten. Des weiteren hat sich [42] nach zu Folge der Carrier „Verizon“ geäußert, er wolle Maßnahmen treffen, die im Falle eines erneuten Vorfalls, die Tragweite mildern soll. Dies soll durhc weitere Kabel und eine dichtere Vermaschung geschehen, so dass man über 3 Kabel bis zu 6 verschiedene Pfade habe. Es soll mindestens ein neues Kabel verlegt werden.


Abbildung 3: SEA-ME-WE3-Verbindung; Quelle: [45]

4.10  Kabelbruch bei Island (17.12.2006)

Das Unterseekabel “CANTAT-3” war in 3000 Meter Tiefe und 1500 Kilometer vor Island beschädigt, so dass mehrere Wochen keine Telekommunikationsverbindungen über dieses Kabel möglich waren [47] [48]. CANTAT-3 ist ein transatlantisches Unterseekabel zwischen Kanada und Europa; zudem hat es Abzweiger nach Island und den Färöer-Inseln. Die Datenrate beträgt 2 x 2.5 Gbit/s. Neben CANTAT-3 hat Island noch eine Verbindung zur Kommunikation durch das Unterseekabel FARICE-1 [50] [51]. Schon im August 2000 war es zu einem Kabelbruch bei CANTAT-3 gekommen [49]. Als Folge des aktuellen Kabelbruches erhielten alle Universitäten, das Universitätskrankenhaus in Reykjavik, zahlreiche Unternehmen und Privatpersonen keine Verbindung zum Internet.

In den Abbildungen 4 und 5 ist erkennbar, dass Island an zwei räumlich getrennte Unterseekabel angeschlossen ist. Island verfügt zwar mit FARICE-1 über eine Backup-Leitung. Bei diesem Kabelbruch benutzten die Provider der betroffenen Internetnutzer nur CANTAT-3. Die Provider wollten anscheinend die durch die Benutzung (Miete von Bandbreite) von FARIC-1 entstehenden Kosten nicht tragen. Um in Zukunft bei einem Kabelbruch besser vorbereitet zu sein, wäre eine Möglichkeit, dass der Internetbenutzer aus Island eine Internetverbindung benutzt, die sowohl über CANTAT-3 als auch über FARIC-1 geht. Noch besser wäre es, wenn der isländische Nutzer eine zusätzliche Internetverbindung via Satellit aufbauen könnte: dann wäre er nicht von den zwei vorhandenen Unterseekabeln abhängig.


Abbildung 4: Route von CANTAT-3. Quelle: [50]


Abbildung 5: Route von FARICE-1. Quelle: [51]

4.11  Informatikum Stellingen (11.10.2006)

Das Netz der Universität Hamburg ist im Prinzip eine 8, die als Knotenpunkt die Telefonzentrale unterhalb des Allende-Platzes hat. Von dort aus geht ein Ring über die Schlüterstraße, die Edmund-Siemers-Allee und den Von-Melle-Park. Ein weiterer Ring geht über Von-Melle-Park, Edmund-Siemers-Allee, Jungiusstraße, Geomatikum und Grrindelallee. Des weiteren gibt es noch eine einzelne Verbindung zur Sternwarte, sowie eine nach Stellingen ins Informatikum und eine über das DESY zu den Botanikern. Den Zugang zum G-WiN (und damit zum Internet) erlangen alle Hamburger Hochschulen über die Schlüterstraße.

Die Pläne, in denen verzeichnet ist, wo welche Glasfaserkabel laufen, liegen bei der Stadt Hamburg und müssen vor jeder Baumaßnahme geprüft werden.

Am 11.10.2006 sollte ein neues Kabel verlegt werden. Dazu wurde ein neuer Kanal mittels eines Torpedos unterirdisch geschaffen. Allerdings wurden dabei auch einige schon bestehende Glasfaserkabel durchtrennt. In Folge dessen war der Zugang der Mitarbeiter des Standort Stellingens ab sofort der Zugang zum Rest des Universitätsnetzwerkes, sowie des G-WiN und damit auch dem Internet verwehrt.

Nach 24 Stunden wurde dann der Standort der Störung gefunden. Ungefähr 1,5 Tage später war die Störung dann behoben. In der Zeit konnten die Mitarbeiter nicht auf das Internet zugreifen.

Um diesen Vorfällen in Zukunft vorzubeugen wurden zunächst verschiedene Maßnahmen in Erwägung gezogen:

Aus einem Paper geht hervor, dass eine DSL-Verbindung schon alleine auf Grund der asymmetrischen Verbindung nicht in Frage kam. Des weiteren war es eine Frage, ob dies überhaupt rechtlich möglich sei, bei privaten Unternehmen noch weitere DSl-Verträge abzuschließen.
Ein rechtliches Problem könnte es auch bei der Anmietung einer zweiten Glasfaserleitung zur Erstellung eines Ringes geben. Zudem ergab ein Gespräch mit zwei Mitarbeitern des RRZ, dass so eine Lösung zu dem Zeitpunkt wohl auch zu kostspielig sei. Schließlich sei unklar, wie lange der Standort Stellingen überhaupt noch zur Universität gehören solle. Wäre der Ausfall einige Jahre zuvor passiert, so wäre dies eine denkbare Alternative gewesen.
Somit blieb noch die Funkverbindung zum Geomatikum übrig. Da man vom Geomatikum aus eine gute Sichtverbindung hat sollte dies technisch möglich sein. Zudem sollte es möglich sein, eine Übertragungsrate von bis zu 100Mbit/s zu erreichen. Da die Tages-Höchstwerte bei ca. 80 Mbit/s liegen und so gut wie nie erreicht werden, sollte diese Leitung in der Lage sein, den gesamten Verkehr zu bewältigen. Somit wäre auch keine Priorisierung der Dienste notwendig, was mit Sicherheit zu weiteren Problemen geführt hätte. Zudem kann dieser Versuch auch als Pilot-Projekt gesehen werden, das im Falle eines Erfolges auch mit den anderen Instituten vollzogen werden kann. Das Geomatikum ist sogar noch von der TU Harburg aus zu sehen. Ein weiterer Vorteil ist auch die Mobilität. Im Falle eines Umzuges des Standort Stellingens wäre so die umkonfigurierung wesentlich vereinfacht.

4.12  Satellitenausfall W3A (09.10.2006)

W3A ist einer von 23 Satelliten, die der europäschische Satellitenbetreiber Eutelsat betreibt. Dieser befindet sich in einer geostationären Umlaufbahn (ca. 36000 km). Neben der Aussendung von Fernseh- und Radioprogramme bietet W3A auch Internetdienste an; er kann dabei mit einer Datenrate von 1750 MBit/s senden. Sendegebiet ist Europa, Nordafrika und der Mittlere Osten. Bei einem Routinemanöver ist es zu “Unregelmässigkeiten” (siehe [52]) gekommen. Über die genaue Ausfallursache findet sich auch in Eutelsats Pressemittelung nichts Konkretes (siehe [53]).

Durch den Ausfall waren tausende Nutzer von Fernsehsendern, Nachrichtenagenturen und Unternehmensnetze betroffen. Dieser Ausfall dauerte knapp 12 Stunden (siehe [54]). Betreiber Eutelsat gelang es, einige Programme und Dienste durch anderen Satelliten anzubieten. Benutzer, die Zugang zum Internet via W3A erhielten, aber keine Umschaltung auf andere Satelliten bekamen, mussten für einige Stunden ohne Kommunikation über das Internet auskommen.

Nutzer von W3A, die abhängig von einem Internetzugang sind, sollten über mehrere unabhängige Verbindungen zum Internet verfügen. Denkbar wäre hier eine Anbindung zu einem weiteren Satelliten neben W3A.

4.13  DNS .ES (30.08.2006)

Der staatliche Domainverwalter ESNIC (https://www.nic.es/) ist dafür verantwortlich, Domains mit der Endung „.es“ zu verwalten. ESNIC hat dazu auch seine eigenen DNS-Server, die die Namensauflösung der Domains mit dem Suffix „.es“ vornehmen. Routinemäßig werden alle 8 Stunden die Datensätze der Server aktualisiert.

Am 30.08.2006 trat ein Softwarefehler bei einer Aktualisiern der Datensätze auf. Dies führte dazu, dass die Datensätze die sich auf die Endungen „.es“ bezogen nicht mehr ausgelesen werden konnten. Laut [66] war so eine sinnvolle Namensauflösung nicht mehr möglich, obwohl die Server voll funktionsfähig waren. Dieser Ausfall fand in der Zeit von 15:15 Uhr bis 17:15 Uhr statt.

Damit waren sämtliche Seiten mit der Endung „.es“ nicht mehr über eine URL aufrufbar, da diese nicht vernünftig aufgelöst wurde. Über die Folgenschwere des Ausfalls gehen die Meinungen auseinander: Während [67] schildert, dass dies zu Verzweifelungen bei den Kunden von Banken führte, sowie zu heißen Diskussionen in Internetforen, ist auf [66] zu entnehmen, dass dieser Ausfall den meisten Internetnutzern überhaupt nicht aufgefallen ist, da alle anderen Endungen ja noch zu erreichen waren. Wobei letzteres eher als Vermutung dargestellt wird.

4.14  Arcors Ausfall in München (03.08.2006)

Das Telekommunikationsunternehmen Arcor betreibt im Münchener Raum ein ISDN- und DSL-Netz. Dieses ist gegen 22 Uhr am 03. August 2006 für mehrere Stunden lang ausgefallen [55], so dass Kunden nicht mehr ihren Telefon- und DSL-Anschluss benutzen konnten. Arcor bezeichnet dieses Störung selbst als “Grossstörung”. Als unpräzisen Grund dafür hat Arcor nur genannt, dass mehrere Geräte im Netzwerk defekt sind. Ob Unwetter, dass zu Zeitpunkt des Ausfalles in München gewütet hat, Ursache des Ausfall gewesen ist, hat Arcor nicht bestätigt.

Mehrer Stunden lang haben die Kunden von Arcor nicht telefonieren und den Internetzugang benutzen können. Da dieser Ausfall an einem Abend geschehen ist, hat diesen Ausfall gemildert, da in Firmen zur Abendzeit meist nicht mehr arbeiten. Personen und Firmen, die auf das Kommunikationsnetz von Arcor angewiesen sind, haben natürlich einen Schaden erlitten.

Da Arcor nur eine schwammige Aussage zum Ausfallgrund hinterlassen hat, ist es schwer eine Massnahme für Arcor vorzuschlagen, die einen weiteren Ausfall verhindern könnte. Benutzer von Arcor sollten sich überlegen, ob sie sich nicht eine zweite Anbindung an eine Telefonnetz oder eine zweite Internetverbindung bei einem weiten Telekommunikationsanbieter leisten sollten, um Redundanz zu erhalten.

4.15  Thailand GSM (18.05.2006)

Laut [68] fand am 17.05.2006 eine Tsunami-Alarmierungsübung in Thailand statt. Im Rahmen der Übung sollten die Kommunikationswege zu den Rundfunkanstalten von Radio und Fernsehen sowie zu den Krisenstäben zu testen. Die Warnmeldungen für den pazifischen Ozean werden von dem „Pacific Tsunami Warning Center“ auf Hawaii herausgegeben.

Während der Übung war ein Ausfall des GSM-Netzes zu beobachten. Dies lässt sich darauf zurückführen, dass durch einen LKW-Unfall eine Verteilerstation außer Betrieb gesetzt wurde.

Dies führte zu Kommunikationsproblemen mittels GSM. Diese schienen aber nicht äußerst kritisch zu sein.

Da das Mobilfunknetz sowieso an Überlast zu leiden schien, wurde ein Ausbau beschlossen, der die Infrastruktur verbessern soll.

4.16  all-ink.com ohne Internetanbindung (22.10.2005)

All-ink.com ist ein Webhoster von 250.000 Domains. Ihre Internetanbindung wird vom Provider Lambdanet gestellt. An Samstag, den 22.10.2005, hat es einen Schaden an einem Switch vom Lambdanet (siehe [56]) gegeben. So ist All-ink.com ohne eine Internetanbindung dagestanden.

Das Webportal von all-ink.com ist durch den Schaden am Switch auch nicht mehr erreichbar gewesen, so dass all-ink.com seine Kunden nicht auf den Ausfall hinweisen konnte. Die Kunden haben die Telefon-Hotline mit Anfragen überhäuft. Für manche Kunden mag diese “Downtime” nicht zu akzeptieren gewesen sein, so dass sie ihre Vertrauen in all-ink.com verloren haben und den Webhoster wechseln. Eventuelle Neukunden können durch diese Ausfallszeit abgeschreckt worden sein und gehen daher gleich zur Konkurrenz.

So wie es scheint, hat all-ink.com nur eine Internetverbinung zum Provider Lambdanet gehabt. Besser wäre es gewesen, wenn all-ink.com zu mehreren unabhängigen Providern eine Internetverbindung gehabt hätte. Redundanz in ihrer Internetanbindung hätte in diesen Fall keinen Ausfall des Webhosting-Dienstes zur Folge gehabt.

4.17  DE-CIX (17.10.2005)

Laut [69] ist „DE-CIX“ (http://www.de-cix.net) der gröste deutsche Internet-Knoten. Hier haben viele Internetprovider einen Zugang zum „Internet“, welches sich außerhalb Deutschlands befindet. Laut [69] gibt es dort drei Haupt-Switches.

Am Montag, dem 17.10.2005 soll ein Switch wegen eines Software-Fehlers um ca. 14:20 Uhr heruntergefahren worden sein.

Die Kunden, die nur einen (oder mehrere) Ports auf diesem Switch angemietet hatten, hatten war der DE-CIX-Knoten somit nicht mehr erreichbar.

Die betroffenen Kunden hatten aber noch alternative Zugangsknoten, so dass im Ganzen bei einigen eine Lasterhöhung zu bemerken war. Dies hatte allerdings keinerlei negative Auswirkungen.

4.18  Ausfall des Backbones bei Level 3 (21.10.2005)

Level 3 Communication ist ein börsennotiertes Unternehmen, welches eines der grössten Internet-Backbone-Netz betreibt. Level 3 hat ein sogenanntes Tier-1-Netzwerk: Level 3 hat es mit Peering-Abkommen geschafft, Zugang zum weltweiten Internet zu erhalten, ohne für IP-Transit zahlen zu müssen, da selbst viele Netzebetreiber sich an Level3s Backbone-Netz anschliessen möchten. Das Netzwerk von Level 3 erstreckt sich über die USA und einen grossen Teil vom westlichen Europas. Dabei sind die über 120 angebundenen Städte über 10 Gbit/s Glasfaserkabel verbunden. Zur transatlantischen Verbindung hat Level 3 Glasfaserkabel mit mehreren 100 Gbit/s auf dem Meeresgrund liegen. Geld verdient Level 3 hauptsächlich durch den Verkauf von Zugang zu ihrer Netzstruktur

Kurz vor neun Uhr deutscher Zeit am 21.10.2007 ist es zu einem Ausfall des Backbone-Netzes von Level 3 gekommen [57], [58]. Nach und nach haben sich verschiedene Netzabschnitte wieder zurückgemeldet. Nach ca. 3 Stunden ist der Ausfall endgültig behoben worden. Level 3 hat Details zu diesem Ausfall nicht genannt. Angeblich soll ein Konfigurations-Update für einen Router in Chicago (OSPF) Schuld gewesen sein [59]. Dieser Router hat dann schnell, viele OSPF-Update-Nachrichten ausgesandet, die andere Router empfingen. Diese Router hatten dann Schwierigkeiten diese Nachrichten zu verarbeiten. Dies hat zu “abnormalen” Bedingungen in Teilen von Level 3s Netz geführt. Ein anderes Gerücht ist, dass Level 3 absichtlich einen Ausfall proviziert hat, um angebundene Carrier zu zwingen, ausstehende Transitgebühren zu zahlen.

Die Folge dieses Ausfalles ist gewesen, dass für viele Nutzer aus Europa der Weg zu Rechnern in die USA abschnitten gewesen ist, wenn diese auf Level 3 angewiesen gewesen sind, um mit Amerika zu kommunizieren.

Der Ausfall hat nicht lange angedauert, maximal drei Stunden. Da Level 3 ein Backbone hat, an dem viele kleinere Provider sich ankoppeln, hat ein Ausfall von diesem Backbone grosse Auswirkungen.

Wenn Kommunikationspartner in Netzen sitzen, die nur über Level3s Backbone miteinander verbunden sind, nützen ihnen eine zweite Leitung zu einem anderen Provider nichts, solange der Provider auch Level3s Backbone benutzen muss. Als Gegenmassnahme hätten die betroffen Nutzer eine zweite Anbindung zu einem Carrier wählen sollen, der nicht Level 3 benutzt. Redundanz in der Verbindung hätte hier geholfen.

4.19  Westösterreichh (23.08.2005)

Nach [71] ist ein Murgang ein Strom aus Schlamm und Gesteinen im Gebirge. Solche Muren können große Verwüstungen bewirken. Muren treten in Gebirgen auf. Die „Telekom Austria“ (http://www.telekom.at) ist nach eigenen Angaben Österreichs führendes Telekommunikationsunternehmen.

Am 23.08.2005 um 13:02 Uhr meldete [70], dass eine Mure die zwei Hauptleitungen von „Telekom Austria“, die über den Arlberg führen zerstört habe.

Dies hatte zur Folge, dass viele Gemeinde in Voralberg nicht mit den Einsatzzentralen kommunizieren konnten. Zudem fiel die internetbasierte polizeiinterne Kommunikation aus. Dadurch kam es auch zu Überlastungen in den Mobilfunknetzen. Natürlich sind nicht nur die Kommunikationswege beeinträchtigt worden, sondern auch die normalen Verkehrswege. Nebenbeit fiel auch noch ein Stromnetz aus, wodurch ein weiteres Mobilfunknetz ausfiel.

Während der Reparaturarbeiten, sollte der Verkehr über eine Ersatzschaltung geleitet werden. Hier gab es aber auch zunächst Probleme, diese aufzubauen.

4.20  DNS-Problem mit Google (07.05.2005)

Google ist ein US-börsennotiertes Unternehmen, welches im Internet eine Suchmaschine betreibt. Google verdient sein Geld mit dem Schalten von Werbung in Verbindung zu bestimmten Suchwörtern. Diese Suchmaschine ist die meistgenutzte Suchmaschine, wenn es darum geht, an Informationen aus dem Internet zu gelangen. Viele Internetnutzer fangen mit der Google-Suchmaschine als Startseite ihres Browsers an und sind fast abhängig von der Erreichbarkeit von Google.

Laut [60] ist es am 07.05.2005 kurz vor Mitternacht MESZ weltweit nicht möglich gewesen DNS-Namen, die Google-Domains betreffen, in IP-Adressen aufzulösen. Der Grund scheint wohl im DNS-System zu liegen, da Google unter seinen IP-Adressen immer noch erreichbar gewesen ist. Ein Sicherheitsproblem oder einen Marketing-Gag wies Google von sich. Eine genauen Grund für diesen Ausfall der Namesauflösung hat Google aber nicht gegeben. Dieser Ausfall hielt eine Viertelstunde lang an.

Internetnutzer, die Google für ihre Internetrecherche nutzen, mussten auf andere Suchmaschinen ausweichen. Die Betreiber anderer Suchmaschinen werden sich über Googles Ausfall wohl gefreut haben. Unerfahrene Internetnutzer haben Panik bekommen, dass ihre Internetverbindung nicht funktioniert, da die bisher immer vorhandene Google-Seite nicht mehr aufrufbar gewesen ist.

Der Ausfall geschah an einem Samstag und hielt auch nur eine kurze Zeit lang an. Dies hat wohl nur geringen Schaden für Google verursacht.

Um diese Art von DNS-Ausfall vorzubeugen, könnten sich Nutzer von Google die IP-Adressen merken. Allzu häufig sollte Google dann nicht aber die IP-Adressen ihrer Suchmaschinenseite ändern.

4.21  Schweiz DSL (14.04.2005)

„Swisscom“ (http://www.swisscom.com/GHQ/content?lang=de) ist das, nach eigenen Angaben, führende Telekommunikations-Unternehmen in der Schweiz.

Wie [72] am 14.04.2005 um 13:37 Uhr meldete, soll um ca. 10:15 Uhr desselben Tages eine Störung im Netz von „Swisscom“ aufgetreten sein soll, als dessen Ursache auf eine Störung im IP-Netz vermutet wird.

Dies hatte zur Folge, dass ungefähr 800.000 ADSL-Kunden keinen Zugang zum Internet hatten. Diese Störung soll aber zur Zeitpunkt der Meldung schon wieder behoben worden sein. Näheres ist nicht bekannt.

4.22  Ausfall des Satelliten Intelsat804 (14.01.2005)

“Intelsat 804” (auch IS-804 genannt) ist ein Kommunikationssatellit im geostationären Orbit ([62]). Er wurde im Dezember 1997 vom Betreiber Intelsat gestartet und bietet Telekommunikationsdienste für Staaten im Südpazifik (Cook Islands, Samoa, American Samoa, the Chatham Islands, Solomon Islands, Kiribati, Niue, Vanuatu, Tokelau, Tuvalu und Tonga) und der US-amerikanischen Forschungsstation “McMurdo” in der Antarktis. Andere Länder wie Südkorea und Vietnam benutzen auch Intelsat 804, haben aber noch andere Kommunikationsverbindungen ins Ausland.

Am 14.01.2005 um 17:32 (EST) gab es laut Intelsats Presseerklärung ([63]) eine “unerwartete Anomaly” in der Stromversorgung. Dieser führte zu einem Totalausfall von IS-804.

Freie Kapazitäten von anderen Satelliten haben die Kommunikationsverbindungen von IS-804 übernommen. Dazu müssten die Transmitter der betroffenen Kommunikationspartner auf andere Satelliten umpositionieren. Es dauerte aber einige Tage bis der Ausfall von IS-804 aufgefangen werden konnte.

Intelsat 804 hatte noch eine Buchwert von 73 Millionen Dollar und ist nicht versichert gewesen. Mehr als eine Millionen sind von diesem Ausfall Menschen betroffenen gewesen ([64]). Diese hatten keine Möglichkeit mehr, internationale Telefongespräche zu führen.

Die vielen kleinen Insel-Staaten im Südpazifik sind nur über IS-804 telefonisch erreichbar gewesen. IS-804 ist also ein Single-Point-of-Failure hier gewesen. Eine zweite alternative Verbindung zu anderen Satelliten hätten diesen Ausfall gemildert. Zumindest wären diese kleinen Insel-Staaten nicht telefonisch von der Aussenwelt getrennt gewesen.

4.23  Intelsat Americas 7 (29.11.2004)

Nach eigenen Worten ist Intelsat (http://www.intelsat.com/) der weltgrößte Anbieter von festen Satelliten-Diensten. Intelsat bietet sowohl Kommunikationsverbindungen über Satellit, als auch über Glasfaserkabel an. Das Netzwerk kann in der Abbildung 6 eingesehen werden. Des weiteren kann man sichauch nährere Informationen zu den einzelnen Satelliten unter [96] einholen. Aus dieser Quelle geht auch hervor, dass der Satellit G-27, früher IA-7, auf der Position 129 westlicher Länge über dem Äquator stationiert ist. Er deckt somit Nordamerika und Canada ab.


Abbildung 6: Intelsat-Netz mit Satellit G-27. Graphic courtesy of Intelsat. Quelle: [96]

Am 29.11.2004 meldete [95], dass der Satellit wegen eines Versagen der Energiesysteme ausgefallen sei. Weitreichende Folgen sind allerdings nicht bekannt. Die Dienste wurden nach dem Ausfall auf umliegende Satelliten verlagert. Des weiteren war schon ein zweiter Satellit, damals IA-8, heute G-28, vorbereitet worden, der Teile der Funktionen von G-27 übernehmen sollte.

4.24  Telefoninfrastrukturausfall in Mittelhessen (10.11.2004)

Die Kreise Limburg-Weilburg und Lahn-Dill liegen in Mittelhessen nahe Frankfurt am Main. Deren Telefoninfrastruktur wird von der Deutschen Telekom gestellt.

Um ca. 15:00 am 10. November fing dieser Ausfall an [65]. Grund war ein Absturz der Vermittlungssoftware in einem zentralen Netzknoten in Weilburg. Nähere Details sind nicht bekannt gegeben. Um 10:00 Uhr des Folgetages war grösstenteils wieder die Telekommunikationsinfrastruktur funktionsbereit.

Die Vorwahlen 06471 und 06479 waren gestört. Auch waren die Notrufnummern von Polizei, Feuerwehr und Rettungsdiensten blockiert. Betroffen waren auch das Mobilfunknetz in dieser Region. Dieser Ausfall hat 19 Stunden gedauert. In dieser Zeit waren nur Ortsgespräche möglich, aber die betroffenen Menschen konnten keine Zugang zum Internet aufbauen.

Offiziel gab es “keine grösseren Schwierigkeiten” laut Polizeipräsidium und Rettungsleitstelle. Dennoch dürfte dieser Ausfall den Menschen in der betroffen Region ein harter Schlag gewesen sein, da sie ohne Vorwarnung über kein Telefon und keinen Internetzugang mehr verfügten.

Als Benutzer hätte man den Ausfall gut überstanden, wenn man mindestens eine weitere Verbindung gehabt hätte, die nicht über die Infrastruktur der Telekom, die von dem Ausfall betroffen gewesen ist, geführt hätte. Da in Deutschland die Telefoninfrakstruktur meistens der Telekom gehört, ist dies schwierig zu realisieren. Vorstellbar wäre eine redundante Anbindung per Satellit; der Normalverbraucher würde dafür ungern Geld ausgeben, aber Firmen, die auf eine funktionierende Telekommunikation angewiesen sind, könnten diese Lösung in Erwähnung ziehen. Ein Anbindung per Satellit wäre günstiger als das Verlegen von einer zweiten redundanten Leitung hin zu einem anderen Infrastruktur-Betreiber.

4.25  isp-service (24.08.2004)

Nach [73] gab es am 24.08.2004 bei dem Internet-Provider „isp-service“ (http://www.isp-service.de/) einen Ausfall an der zentralen Glasfaserleitung.

Dies hatte zur Folge, dass zahlreiche DSL-Zugänge gestört, bzw. nicht verfügbar waren. Zudem waren die Tochter-Unternehmen „NewDSl“ und „Expressnet“, die auch an diesem Backbone hingen, ebenfalls betroffen. Man konnte sich zwar noch über den RADIUS („Remote Authentification Dial-In User Service“)-Server anmelden, aber nicht mehr von dort aus über den Backbone ins Internet. Weiteres ist nicht bekannt.

4.26  Kein Mobilfunknetz von T-Mobile in MVP und Nordbrandenburg (27.02.2004)

T-Mobile ist die Mobilfunksparte der Deutschen Telekom und ist Marktführer in Deutschland. Sie betreibt ein Deutschland-weites Mobilfunknetz.

Am Freitag gegen halb acht am Morgen ist in grossen Teilen von Mecklenburg-Vorpommern und Nordbrandenburg das Mobilfunknetz von T-Mobile ausgefallen [74, 75]. Laut eines T-Mobile-Sprechers ist der Grund für dieses Ausfall ein Vermittlungsrechner in Rostock gewesen.. Dort trat bei Wartungsarbeiten ein Softwarefehler auf, der zu diesem grossflächigen Ausfall geführt hat. Nähere Details zu diesem Ausfall gibt es nicht. Nach viereinhalb Stunden ist der Schaden behoben worden.

Während dem Zeitraum des Ausfalls konnten Kunden von T-Mobile keine Mobilfunkgespräche führen. Dadurch erlitt T-Mobile einen Verlust an Umsatz. Kunden von T-Mobile werden sich über den Ausfall des Mobilfunknetzes ihrers Providers geärgert haben.

An einem Freitag vormittag wird in Betrieben noch gearbeitet und manche Betriebe werden auf dem Vorhandensein eines funktionieren Mobilfunknetz angewiesen sein. Dies dürfte die Kunden von T-Mobile in dieser Region verärgert haben. Da dieser Ausfall so lange gedauert hat, stellt sich die Frage, ob T-Mobile keine Backup-Systeme installiert gehabt hat.

In diesem Ausfall hätte der betroffene Mensch in dieser Region seine Erreichbarkeit erhalten können, indem er einen weiteren anderen Mobilfunkanbieter benutzt hätte, um somit Providerunabhängigkeit zu erreichen. Aber wohl nur die wenigsten Menschen werden sich einlassen, sich mit zwei oder mehr Mobilfunkgeräten von verschiedenen Anbietern auszustatten, nur um einen Mobilfunkausfall zu überleben, da solche Ausfälle nicht häufig stattfinden.

4.27  UK Internet traffic (25.11.2003)

Wie unter [90] nachzulesen ist, ist das TAT-4 die Abkürzung von Trans Atlantic Telephonecable Number 14. Es wurde am 21. März 2001 nach einer zweieinhalbjähriger Bauzeit eingeweiht. Nach eigenen Angaben ([89]) verbindet dieses Kabel die Vereinigten Staaten mit to dem Vereinigte Königreich (England), Frankreich, den Niederlanden, Deutschland und Dänemark. Wie der Karte in Abbildung 7 zu entnehmen ist, ist es eine doppelte Verbindung.


Abbildung 7: TAT-14 Landing Station Map;Quelle: [92]

Nach der Spezifikation hat das Kabel eine Kapazität von 640Gbit über jedes dieser zwei Glasfaserkabel. Diese werden noch einmal von 2 weiteren Glasfasern mit einem Backup versehen. Die Länge ist nach [90, 91] 15.000 km und die Dicke 50mm.

[88] zufolge ist am Dienstag, den 25.11.2003, um 15:39 am Nachmittag eine Störung aufgetreten. Die Lokalität, an der die Störung auftrat, soll sich nach einem Sprecher von BT (http://www.bt.com/), einem Mitglied des Konsortiums zwischen Frankreich und den Niederlanden befinden. Am darauf folgenden Tag um 7:46 ist der Ausfallbehoben behoben [93]. Die Telefonverbindungen waren weniger betroffen als die Datenübertragung. Es wurden Verluste von 32Gibt/s an Daten gemeldet. Insgesammt mussten wohl mehrere englische Provider mit Störungen und Einbußen leben.

Die Störung sollte nach den Angaben eines Vernatwortlichen bis zum Ende der Woche behoben worden sein.

4.28  E-Plus (27.10.2000)

Am 27.10.2000 um 13:52 Uhr meldete [94], dass das Mobilfunknetz des deutschen Mobilfunkbetreibers E-Plus (http://www.eplus.de) bundesweit seit 8.15 Uhr desselben Tages abgestürzt sei. Grund sei ein Fehler in der Signalisierungssoftware der bundesweit 35 Vermittlungsstellen von E-Plus gewesen.

Als Folge konnten sich ein Viertel der Kunden nicht mehr in das Mobilfunknetz einwählen.

Einem Sprecher zufolge war die Störung aber zum Nachmittag hin wieder behoben.

4.29  Ausfall trotz USV bei Strato (22.12.1999)

Die Firma Strato bietet Kunden Webhosting-Dienste und Domains an. Dabei benutzt sie das Rechenzentrum vom Internet-Service-Provider XLink in Karlsruhe.

Am Mittwoch, den 22.12.1999, um 10 Uhr kam es zu einem Komplettausfall der von Strato gehaltenen Kundendomains [76, 77]. Auch die Strato-Homepage war nicht erreichbar. Grund war ein Stromausfall bei XLink. Eine Elektrofirma hat Wartungsarbeiten an der unterbrechungsfreien Stromversorgung (USV) durchgeführt. Dabei kam es zu einer Spannungsspitze durch einen Kurzschluss und dadurch zum Ausfall aller Strato-Domains. Das Rechenzentrum hat zwar eine USV, doch dieser Kurzschluss entstand hinter der USV, so dass die USV hier unnütz war. Diese Wartungsarbeiten sollen nicht mit XLink abgesprochen gewesen sein. Durch diesen Absturz müssen auf allen Systemen erst ein Filesystem-Check durchgeführt werden, welcher sehr lange dauert, da die einzelnen Rechner über ein konsistentes Dateisystem verfügen sollen, bevor die Domains wieder ansprechbar sein sollen. Um 16 Uhr waren die von Strato gehosteten Domains wieder ansprechbar.

Sechs Stunden dauerte dieser Ausfall. In dieser Zeit sind 400.000 Internet-Präsenzen bei Strato nicht erreichbar gewesen. Besonders tragisch ist gewesen, dass dieser Ausfall nicht nur in der Hauptverkehrszeit, sondern auch noch zur Weihnachtszeit eingetreten ist. Vielen Online-Shops, die bei Strato gehostet waren, entstanden dadurch Verluste; viele Kunden von Strato waren sehr verärgert. Verschlimmert wurde die Lage durch Stratos Kommunikationspolitik in dieser Krise: es wurde von Unternehmensseite nichts kommentiert. Stratos Hauptkonkurrent 1&1 PureTec wollte aus Stratos Pech Kapital schlagen und bot allen Strato-Kunden einen kostenlosen Wechsel ihrer Domain zu 1&1 an.

Im Sommer 1999 ist Strato noch mit Auszeichnungen überhäuft worden, wie z.B. “Web-Space-Provider des Jahres 1999” durch die Zeitschrift Internet World. In dieser Zeit des Internet-Booms wächst Stratos Kundenstamm um 30 Prozent jeden Monat. Strato ist wohl ein Opfer seines eigenen Erfolges: diese Firma ist schnell gewachsen – wahrscheinlich zu schnell. So sind auch die diverse Probleme mit der Technik bei Strato um den Jahreswechsel 1999/2000 herum zu erklären [77]. Der Kurzschluss mit der USV hätte eigentlich nicht passieren dürfen; auch ist es verwunderlich, wieso überhaupt eine Elektrik-Operation hinter der USV und noch dazu bei den Unternehmens-kritschen Rechnern erlaubt worden ist. Wahrscheinlich ist die Möglichkeit eines Auftretens eines Kurzschlusses unterschätzt worden.

Dieser Ausfall hätte vermieden werden können, wenn diese Elektrik-Wartungsarbeiten besser vorbereitet gewesen wären, d.h. die Rechner hätten vor einem Kurzschluss bei den Wartungsarbeiten noch geschützt werden. Wenn ein Kunde eine kommerziellen Web-Shop betreibt und von diesem sehr stark abhängig ist, sollte dieser Kunde überlegen, eine dedizierte Lösung zu finden und nicht bei einem Massen-Webhoster wie Strato seinen Shop zu halten. Vielleicht hätte der Web-Shop-Betreiber auch mit Strato in einem Vertrag festhalten können, dass er eine Mindest-Verfügbarkeit von Strato fordert wie z.B. 99,999% im Jahr. Das wäre sicherlich preislich teuerer für den Kunde, doch müsste bei einer Nicht-Verfügbarkeit die Firma Strato für den entstandenen Schaden zahlen.

4.30  T-Online (22.10.1997)

Für den Fall eines Notfalls wird der Web-Server bei T-Online (http://www.t-online.de komplett gespiegelt. So kann bei einer Storung einfach umgestellt werden.

Am 22.10.2007 war laut [97] der Webserver den ganzen Tag nicht zu erreichen. Dies lag daran, dass auch der Backup-Server eine Technische Störung hatte und somit das Umschalten nicht wie geplant funktioniert hat.

4.31  Keine .com und .net TLDs mehr (17.07.1997)

Die Firma “Network Solutions Inc.” (NSI) war zum betreffenden Ausfallszeitpunkt für die Verwaltung der Toplevel-Domains (TLD) .com und .net verantwortlich. Bei NSI konnte man sich zudem Domainnamen registieren lassen. Das Domain Name System (DNS) wird gebraucht, damit menschenlesbaren Domainnamen zu numerischen IP-Addressen umgewandelt werden können. NSI erzeugt auch die “zone files” von den .com- und .net-TLDs für die Root-Server. Diese “zone files” defineren im DNS eine Abbildung vom Domainname zu IP-Addressen.

Ab 2:30 Uhr (EDT) morgens funktionierte das Internet nicht mehr richtig. [78, 79, 80]. Das Problem began bereits am Vortag um 23:30 (EDT). Bei NSI in Virginia, USA, wird automatisch von einem Programm aus einer Datenbank heraus für die .com- und .net-TLDs “zone files” generiert. Diesmal klappte diese Generierung aber nicht, was die Einträge für .com- und .net-TLDs unbrauchbar machte. Aufkommende Alarme und Fehlermeldung des Programmes wurden vom verantwortlichen Mitarbeiter bei NSI ignoriert, so dass einem Aussenden dieser “zone files” nichts mehr im Wege stand. Um 2:30 (EDT) wurde dieses beschädigte Update für die Root Nameserver ausgesandt. Wegen dieser Unachtsamkeit eines einzelnen Person wurden so korrupte “zone files ” verteilt. Sieben von neun DNS-Root-Server waren von diesem kaputten Update betroffen. Von den DNS-Root-Server wurden diese kaputten Informationen dann weiter an andere Nameserver verteilt. Um 6:30 (EDT) wurde dieser teilweise Ausfall des DNS beseitigt, indem korrekte “zone files” an die Root-Server versandt wurden.

Die Folgen dieses missglückten Update war, dass die Domainnamen mit der TLDs .com und .net nicht mehr in ihre dazugehörige IP-Addresse auflösbar gewesen sind. DNS war also unbrauchbar für diese TLDs geworden. Vier Stunden hielt diese Störung an. Während dieser Zeit konnte keine Email, die an Adressen der betroffenen TLDs ging, zugestellt werden. Zuerst haben europäische Nutzer diesen Ausfall gespürt: tausende ihrer Emails wurden nicht angenommen. Weite Bereiche des Internets waren in den USA nicht erreichbar. Domainnamen von Webservern grosser Firmen waren ebenfalls nicht in IP-Adressen auflösbar.

Diese Störung ist die bis dahin grösste des Internets gewesen. Störungen von DNS-Root-Server haben massive Folgen auf das gesamte Internet. Da fast alle .com-TLDs betroffen waren, konnten E-Commerce-Seite nicht mehr gefunden werden. Dies dürfte zu Umsatzeinbussen bei den Betreibern geführt haben. Der “single point of failure” ist hier die Generierung der “zone files” gewesen: Nur ein einzelner Mensch ist für die Überwachung verantworlich gewesen. Aber nicht alle Internet-Teilnetze waren betroffen: einige haben einen eigenen DNS-Server betrieben, der über einen eigenen Cache von IP- und Domainname-Addressen verfügte. Diese Nameserver mussten also nicht die Root-Nameserver abfragen, da sie bisherige Antworten zwischengespeichert haben. Dadurch kamen sie nicht in den Kontakt mit den kaputten Datensätzen.

Als erste Gegenmassnahme wollte NSI mehr Schutzmassnahmen vor dem Verschicken der “zone files” einbauen. Ob dadurch kaputte “zone files” vermieden werden können, ist aber fraglich. Ein Benutzer kann sich vor derartigen DNS-Problemen schützen, indem er sich die IP-Addresse seines Kommunikationspartner merkt und sich nicht auf das Auflösen des Domainnames verlässt. Ein andere Lösung wäre das Betreiben eines eigenen Caching-DNS-Servers, der Antworten anderer DNS-Server zwischenspeichert. Hier muss man aber hoffen, dass DNS-Probleme schnell gelöst werden, denn irgendwann veralten auch die Einträge im Caching-DNS-Server. Dann ist auch dieser Server gezwungen, DNS-Anfragen weiterzuleiten, womit er auch kaputte Anwort-Datensätze erhalten kann.

4.32  AOL (08.08.1996)

Bei dem amerikanischen Internet Provider American OnLine (AOL) wurde am 07.08.2006 ein Software-Update bei den Routern und Switches des Netzwerkes eingespielt. Während dieser Periode wurden natürlich auch Updates bei den Routing-Tabellen vorgenommen. Dabei kam es zu einem fehlerhaften Update der Routing-Tabellen, so dass das Netzwerk nicht mehr funktionsfähig war. Da während des Software-Updates auch die Netzwerkdiagnose-Software abgestellt wurde, kamen die Techniker zu dem fehlerhaften Schluss, dass das Software-Update Schuld an Disfunktionalität sei. Dies hatte zur Folge, dass die Fehlerquelle erst nach 19 Stunden behoben wurde. In der Zeit vom 07.08.2006 16 Uhr bis 08.08.2006 11 Uhr konnten die 16 Mio. Benutzer keine Verbindung aufbauen. Als Entschädigung bekamen sie von AOL einen Tag kostenlose Dienste.

4.33  Ausfall von Vermittlungsrechner legt New Yorker Flughäfen lahm (17.09.1991)

AT&T war zum Unglückszeitpunkt der grösste Telefonanbieter in den USA und dominierte sowohl bei den Fern- als auch Ortsgesprächen den Markt. Zum Zeitpunkt dieses Unglücks hat AT&T “No. 4 Electronic Switching Systems” (4-ESS) in den betroffenen Vermittlungsstellen verwendet. 4-ESS ist bei seiner Einführung das erste digital elektronische Vermittlungrechner für Ferngespräche gewesen.

Am 17.09.1991 kam es zu einem internen Stromausfall in einem von AT&Ts Vermittlungscentern mit “4-ESS”-Systemen in Manhattan [81, 82]. Dieser Vermittlungscenter war für die Weiterleitung von Ferngesprächen und den lokalen Anschlüssen rund um Manhattan verantwortlich. Einer Theorie zur Folge war der Grund für diesen Stromausfall im Vermittlungscenter, dass AT&T dem Energieversorger “Consolidated Edison, Inc” (ConEd) helfen wollte: Am Tag des Ausfall herrschten sehr heisse Temperaturen in New York; durch die Verwendung ihrer internen Stromgeneratoren wollte AT&T dem Energieversorger entlasten. Doch es wurde irgendwie übersehen, dass diese Stromgeneratoren nicht richtig an das System angeschlossen waren und daher nicht hilfreich waren. Deshalb liefen das Vermittlungscenter für sechs Stunden auf Batterien: nach dieser Zeit waren die Batterien leer, so dass dieses Vermittlungscenter nicht mehr benutzbar geworden war und so ausfiel.

Die Anrufe wurden auf die zwei noch übrigen Vermittlungsstellen umgeleitet, doch diese konnten den ungewohnt hohen Verkehr nicht abarbeiten. Ca. 5 Millionen Telefongesprächen wurden als Folge blockiert. Betroffen waren Ferngespräche sowohl in die Stadt also auch aus der Stadt heraus. Die Funktürme der Flugleitungen der New Yorker Flughäfen wurden durch ein Netzwerk von Telephonkabel verbunden. Durch den Ausfall vom Vermittlungscenter war keine Kommunikation mehr mit diesen Funktürmen mehr möglich. Dies führte zur Schliessung aller drei New Yorker Flughäfen für vier Stunden, nämlich von 17 Uhr bis 21 Uhr. Dadurch wurden 1.174 Flüge entweder verzögert oder sogar abgesetzt.

Besonders tragisch and diesem Ausfall war, dass er an einem Dienstag nachmittag geschah, also mitten in der Woche und zur vollen Geschäftszeit. AT&T ist nicht fähig gewesen, die Gespräche auf andere Vermittlungsrechner umzuleiten. Dieser Vorfall zeigt, wie abhängig das Telefonnetzwerk von einzelnen funktionierenden Geräten ist. Zudem wird hier deutlich, dass Redundanz, alternative Vermittlungswege und Notstromgeneratoren, wie sie AT&T eingesetzt hat, immer noch nicht ausreichen, um einen solchen Ausfall zu verhindern. Wenn die Theorie stimmt, dass die internen Stromgeneratoren nicht korrekt an das System angeschlossen waren, wäre dies peinlich für AT&T.

Um in Zukunft einen solchen Ausfall zu vermeiden, kann AT&T ihrer Stromgeneratoren testen, ob diese auch richtig mit dem System verbunden sind. Auch sollte die Flugsicherung ein eigenes Telefonnetz betreiben, um mit ihren Funktürmen zu kommunizieren. Dann wären sie nicht von der Politik eines Telefonnetzbetreibers wie AT&T abhängig.

4.34  Programmkorrekturversuch (26.06.1991)

Wie [103] zu entnehmen war, fand bei dem Versuch einer Fehlerbehebung bei dem amerikanischen Telefonanbieter “Bell Atlantic“ eine Verschlimmerung des Fehlers statt. Dies kam daher, dass aus Sicherheitsgründen 4 Switches zusammengeschlossen wurden, um den Ausfall bei der Korrektur zu kompensieren. Leider breitete sich der Fehler durch das Verbinden auch auf die übrigen Switches aus, was zu einem Ausfall in dem Gebiet von Baltimore bis Washingtnon und West Virginia führte.

4.35  Störung der Telefoninfrastruktur in New Jersey (04.01.1991)

AT&T war zu diesem Zeitpunkt der grösste Telefonkonzern in den USA. Viele Ferngespräche hat diese Firma über Glasfaserkabel geführt.

Am 04.01.1991 um 9:30 Uhr haben Arbeiter von AT&T in der Stadt Newark, New Jersey, ein altes Kabel entfernt. Dabei wurde aber versehentlich ein Glasfaserkabel beschädigt, welches für ein reibungslosen Betrieb der Telefoninfrastruktur benötigt wurde [83]. Mindestens zwei Tage dauerte diese Störung an [84].

Diese Störung des Telefonnetzes begann an einem Freitag Vormittag, also zur Geschäftszeit. Das beschädigte Glasfaserkabel konnte ca. 100.000 Anrufe gleichzeitig übertragen. Dass plötzlich dieses Kabel nicht mehr benutzbar war, hatte u.a. zur Folge, dass die Warenterminbörse “New York Mercantile Exchange” schliessen musste. Ausserdem wurde die Kommunikation der Flugraumkontrolle im Raum New York, Washington und Boston lahm gelegt: lange Flugverzögerungen an den Flughäfen waren die Folge. So wurden 60% aller Telefonverbindungen von und nach New York blockiert. Aber auch Überseeverbindungen waren betroffen [84].

Dieser Ausfall ist weitreichend gewesen, denn er dauerte mindestens zwei Tage lang an und hat den Flugzeugverkehr und Handelsmarktplätze gestört. Das eine Trennung eines Glasfaserkabels solche Auswirkungen hat, sollte man nicht für möglich halten. Auch fragt man sich, ob AT&T keine Alternativroute schalten konnte.

Eine redundante Anbindung ans Telefonnetz hätte diese Störung gemildert. Vielleicht hätte eine Verbindung via Satellit schon ausgereicht, um auf mehreren Wegen erreichbar sein zu können. Extra für Redundanz in einer Stadt neue Kabel zu verlegen, mag zu aufwendig sein.

4.36  Störung AT&T (15.01.1991)

Wie [101] und [102] zu entehmen ist, fiel am 15.01.1990 das Telefonsystem des amerikanischen Telefondienstanbieters AT&T aus.

Der Grund hierfür war ein Fehler in einem einzelnen Computer-Programm. Es war fehlerhafter Code, der mit der neuen Software für die Prozessoren der Switches geladen wurde. Die Initialisierung der Switches danach dauerte 4-6 Sekunden. Danach wurden zwischen den Switches verschiedene Initialisierungsnachrichten verschickt, die schlussendlich dazu führten, dass die Switches glaubten, dass ihre Prozessoren nicht mehr korrekt funtkionierten und sich somit vorsorglich abschalteten, um das Problem nicht mit der Weiterreichung weiterer vermeintlich fehlerhafter Nachrichten zu vergrößern. Dies reichte sich in einer Kettenreaktion weiter.

Die Nachrichtenmenge wurde von AT&T verringert, so dass die Switches nicht mehr von zu vielen Initialisierungsnachrichten „verwirrt“ werden sollten.

4.37  Streckenausfall im ARPANET (12.12.1986)

Das ARPANET (Advanced Research Projects Agency Network) wurde vom US-Verteidigungsministerium ins Leben gerufen. Es ist das erste Computerkommunikationsnetzgewesen, welches Packetvermittlung einsetzte, und gilt als Vorläufer des heutigen Internets. Zum Zeitpunkt dieses Unglücks hatte das ARPANET knapp 10.000 Rechner [85]. Die Aufgabe des ARPANETs war die Verbindung von Forschungseinrichtungen in den USA.

Am 12.12.1986 um 1:11 Uhr Nachts (EST) bemerkte der Telekommunikationsinfrastrukturbetreiber AT&T eine Trennung eines Glasfaserkabels zwischen Newark, New Jersey, und White Plains, New York [86, 87]. Dieses Glasfaserkabel hat sieben logisch getrennte Einzelverbindungen (Trunks) repräsentiert. Doch wurden diese sieben Trunks durch das gleiche Glasfaserkabel geführt. Als das Kabel durchtrennt war, waren alle diese Trunks zerstört. Ursache für diese Trennung des Kabels ist nicht bekannt. Um 12:12 Uhr war der Schaden jedoch behoben.

Dieser Ausfall geschah an einem Freitag und dauerte elf Stunden lang, also zu einer Geschäftszeit. Das öffentliche Telefonnetz im Nordosten war getrennt vom restlichen Netzwerk. Auch MILNET, das Computernetz des US-Militärs war betroffen, doch nicht so stark wie das ARPANET, weil es über mehr Redundanzen verfügte. Emails mussten in den Warteschlagen stehen bleiben, bis der Leitungsschaden behoben wurde.

Für die betroffen Personen war es schwer zu verdauen, dass das ARPANET doch nicht so viel Redundanz hat, wie sie gehofft haben. Es liegt eine scheinbare Redundanz vor, wenn mehrere Einzelkabel den selben Weg gehen. Meistens zeigen Netzstruktur-Pläne immer die logische Topologie und nicht die physikalischen Wege, über die die Leitungen gehen. Logisch unterschiedliche Pfade können wie in diesem Fall den gleichen physikalischen Pfad haben. Das kann zur Augenwischerei führen, wenn die Zuverlässigkeit von Netzen bewertet werden soll. Es gibt aber auch einen Vorteil, mehrere logische Kabelverbindungen über ein Kabel zu leiten: Tritt ein Schaden am Kabel aus, merken es viele Menschen. Da es viele betroffene Menschen gibt, hat der Betreiber mehr Ehrgeiz den Schaden zu beheben als wenn nur eine einzige Person betroffen ist. Aus Sicht des Betreibers ist es zudem einfacher, einen einzigen Kanal auszugraben und dort mehrere Kabel zu verlegen, als jedes Kabel in einem eigenen Graben zu verbuddeln.

Dieser Ausfall zeigt, dass eine physikalische Trennung der Packetwege wichtig ist. Um in Zukunft einen solchen Ausfall zu verhindern, könnte man verschiedene Telekommunikationsanbieter benutzen. Dabei muss aber sichergestellt werden, das jeder Anbieter eine eigene und von anderen Anbietern getrennte Infrastruktur besitzen. Sonst braucht man diesen zweiten Anbieter gar nicht. Da es immer wieder vorkommt, dass ein Telekommunikationskabel gekappt wird, kann man erwägen, eine drahtlose Kommunikationsstrecke zu benutzen, z.B. via Satellit.

5  Fazit

Die Ursachen für Netzausfälle und -störungen sind mannigfaltig: viele Ursachen hat man auch beim Netzbetrieb gar nicht in Betracht gezogen. Oft kommt ein Netzzuverlässigkeitsproblem überrasched und ohne Vorwarnung. Die Sammlung von Netzausfällen zeigt uns, dass Redundanz in der Kommunkationsverbindungen oft geholfen hätten, den Ausfall/die Störung zu überstehen.

Wir haben die Erfahrung gemacht, dass es oft schwierig ist an genaue Informationen über das Unglück zu gelangen. Am liebsten wäre uns gewesen, wenn es zu jedem Ausfall einen offiziellen Bericht gegeben hätte, der das Unglück umfassend beschreibt. Solch ein Bericht kann den Namen “Reason For Outage” (RFO) haben. Im Beispiel des Ausfall des Backbone-Netzes von Level 3 haben wir tatsächlich einen RFO in einer Netzadminstator-Mailing-Liste gefunden [59]. Dieser RFO enthielt alle wichtigen Daten, die den Ausfall betrafen. Zu den Daten zählen folgende Punkte:

Hier wurde wirklich offengelegt, was die Ursache des Ausfalls/ der Störung gewesen ist. Das ist vorbildlich gewesen.

Literatur

[1]
Heise.de, “Internet-Störungen”, http://www.heise.de/imonitor/
[2]
google.de, Web-Interface zu “comp.risks”, http://groups.google.de/group/comp.risks/about
[3]
heise.de, “Berichte: Kamerun seit einer Woche offline”, http://www.heise.de/netze/news/meldung/98557 06.11.2007
[4]
Gerard Jensen, “Cameroon is offline for 8 days now”, http://www.namforum.com/blog/index.php?/archives/105-Cameroon-is-offline-for-8-days-now.html 07.11.2007
[5]
Douala, “Internet access off in Cameroon for 7th day”, http://www.afriquenligne.fr/news/daily-news/internet-access-off-in-cameroon-for-7th-day-2007110610772/ 06.11.2007
[6]
Wikipedia, “The route of the combined SAT3-WASC/SAFE submarine communications cables.” http://en.wikipedia.org/wiki/Image:SAFE-SAT3-WASC-route.png
[7]
Martyn Williams, “Millions disconnected by NTT broadband outage”, http://www.networkworld.com/news/2007/051507-millions-disconnected-by-ntt-broadband.html, 15.05.2007
[8]
Jim Duffy, “Cisco routers caused major outage in Japan: report”, http://www.networkworld.com/news/2007/051607-cisco-routers-major-outage-japan.html, 16.05.2007
[9]
heise.de, “200 Millionen DSL-Kunden weltweit”, http://www.heise.de/netze/news/meldung/90737, 06.06.2007
[10]
wbztv.com, “Fire Shuts Down Longfellow Bridge For Hours”, http://wbztv.com/topstories/local_story_121202334.html, 01.05.2007
[11]
heise.de, “Rauchen gefährdet den Datenverkehr”, http://www.heise.de/netze/news/meldung/89258 04.05.2007
[12]
Chris Robbs Blog, “ Update on the Boston bridge fire” http://i2net.blogspot.com/2007/05/update-on-boston-bridge-fire.html 02.05.2007
[13]
Chris Robbs Blog, “Boston circuits update”, http://i2net.blogspot.com/2007/05/boston-circuits-update.html, 02.05.2007
[14]
internet2.edu, Internet 2 Network, http://www.internet2.edu/news/media/network_map.pdf, 09.02.2007
[15]
heise.de, “Estland wählt per Internet” http://www.heise.de/newsticker/meldung/85921, 27.02.2007
[16]
heise.de, “Unbekannte attackieren estländische Regierungs-Webseiten”, http://www.heise.de/security/news/meldung/89013, 28.04.2007
[17]
Jose Nazario, “Estonian DDoS Attacks - A summary to date”, http://asert.arbornetworks.com/2007/05/estonian-ddos-attacks-a-summary-to-date/, 17.05.2007
[18]
ZEIT online, “Estland: Demontage von Kriegerdenkmal in Tallinn begonnen”, http://www.zeit.de/news/artikel/2007/04/26/100758.xml, 26.04.2007
[19]
smh.com.au, “Cyber attacks force Estonian bank to close website”, http://www.smh.com.au/news/breaking-news/cyber-attacks-force-estonian-bank-to-close-website/2007/05/16/1178995171916.html, 16.05.2007
[20]
heise.de, “Estland beschuldigt Russland des Cyberterrorismus”, http://www.heise.de/newsticker/meldung/89857, 17.05.2007
[21]
heise.de, “DDoS-Angriffe auf estnische Server waren kein "Cyberwar“', http://www.heise.de/newsticker/meldung/91055, 12.06.2007
[22]
heise.de, “In Estland wurde der Cyber-Krieg getestet”, http://www.heise.de/newsticker/meldung/90340, 29.05.2007
[23]
heise.de, “NATO will sich gegen Cyber-Attacken rüsten”, http://www.heise.de/newsticker/meldung/91219, 16.06.2007
[24]
OpenBSD's packet filter pf about synproxy, “PF: Packet Filtering”, http://www.openbsd.org/faq/pf/filter.html, 07.05.2007
[25]
Syed Obaid Amin, Myung Soo Kang, Choong Seon Hong, “A Lightweight IP Traceback Mechanism on IPv6”, EUC Workshops, http://www.springerlink.com/content/nn008186672l1726/, 2006
[26]
abcnews.go.com, “Major BlackBerry Outage Leaves Millions Without E-Mail” http://abcnews.go.com/Business/story?id=3052158, 18.04.2007
[27]
news.com.com, “RIM offers explanation for massive outage”, http://news.com.com/2100-1039_3-6177829.html, 19.04.2007
[28]
news.com.com, “BlackBerry outage: RIM a victim of its own success?” http://news.com.com/BlackBerry+outage+RIM+a+victim+of+its+own+success/2100-1039_3-6177349.html, 18.04.2007
[29]
David Tran, “Optical Fiber Cable Links Three Nations”, http://www.nikkeibp.com/nea/may/maynam.html,
[30]
english.vietnam.vn, “11km lost undersea cable worth millions of USD”, http://english.vietnamnet.vn/tech/2007/05/692179/, 07.05.2007
[31]
english.vietnamnet.vn, “Over 11km undersea optical cable lost”, http://english.vietnamnet.vn/tech/2007/05/692047/, 07.05.2007
[32]
heise.de, “Diebe stehlen Seekabel vor Vietnam”, http://www.heise.de/netze/news/meldung/90357, 30.05.2007
[33]
thanhniennews.com, “Vietnam faces isolation following theft of undersea cable”, http://www.thanhniennews.com/features/?catid=10&newsid=28543
[34]
intellasia.com, “Navy ordered to stop underwater internet cable theft”, http://www.intellasia.com/news/english/articles/info-tech/111229153.shtml, 25.05.2007
[35]
english.vietnamnet.vn, “Losses from telecom cable breakup estimated at US$4mil”, http://english.vietnamnet.vn/tech/2007/05/700176/, 29.05.2007
[36]
photonics.com, “$500M Undersea Cable System to Link US, Southeast Asia”, http://www.photonics.com/content/news/2007/May/1/87466.aspx, 01.05.2007
[37]
Heise.de, „Google.de in fremder Hand [Update]“ http://www.heise.de/newsticker/meldung/84074/from/atom10, 23.01.2007
[38]
Heise.de, „Google.de in fremder Hand [Update]“ http://www.heise.de/netze/news/meldung/84080/from/atom10, 23.01.2007
[39]
Meldung bei Heise.de, “Mailservice beim Webhoster 1&1 gestört”, http://www.heise.de/newsticker/meldung/83737, 15.01.2007
[40]
Heise.de, „Internet in Asien wegen Erdbebenschäden verlangsamt“ http://www.heise.de/netze/news/meldung/82984/from/atom10, 27.12.2006
[41]
Heise.de, „"Rückfall ins Telefonzeitalter" nach Erdbeben“ http://www.heise.de/netze/news/meldung/83007/from/atom10, 28.12.2006
[42]
Heise.de, „Verizon will Übersee-Verbindungen vor Ausfällen sichern“ http://www.heise.de/netze/news/meldung/83091/from/atom10, 02.01.2007
[43]
Heise.de, „Reparatur an Unterseekabeln in Asien kommt nicht voran“ http://www.heise.de/netze/news/meldung/83742/from/atom10, 16.01.2007
[44]
http://www.smw3.com/
[45]
http://en.wikipedia.org/wiki/Image:SEA-ME-WE-3-Route.png
[46]
Heise.de, „Internetverkehr in Asien normalisiert sich“ http://www.heise.de/netze/news/meldung/84819, 05.02.2007
[47]
Meldung bei Heise.de, “Kabelbruch im Atlantik koppelt Island vom Internet ab” http://www.heise.de/netze/news/meldung/82700, 18.12.2006
[48]
Meldung bei businessportal24.com, “Kabelbruch koppelt Island vom Internet ab ”, http://www.businessportal24.com/de/Kabelbruch_Island_Internet_84674.html, 18.12.2006
[49]
Meldung bei Heise.de, “Island nach Kabelbruch stundenlang vom Internet getrennt”, http://www.heise.de/newsticker/meldung/11020, 02.08.2000
[50]
en.Wikipedia.org, “CANTAT-3”, http://en.wikipedia.org/wiki/CANTAT-3
[51]
en.wikipedia.org, “FARICE-1”, http://en.wikipedia.org/wiki/FARICE-1
[52]
www.satundkabel.de, “Überraschender Ausfall von Eutelsat W3 - Störung soll bald behoben sein”, http://www.satundkabel.de/modules.php?op=modload&name=News&file=article&sid=11629&mode=thread&order=0&thold=0
[53]
www.eutelsat.com, “FULL SERVICE RESTORED ON EUTELSAT's W3A SATELLITE”, http://www.eutelsat.com/news/compress/en/2006/pdf/PR4706StatementW3A.pdf
[54]
www.sat-index.com, “Chronology of satellite failures”, http://www.sat-index.com/failures/timeline.html
[55]
Golem.de, “Massiver Netzausfall bei Arcor”, http://www.golem.de/0608/46950.html, 03.08.2006
[56]
Heise.de, “Totalausfall beim Webhoster all-inkl.com”, http://www.heise.de/newsticker/meldung/65241 22.10.2005
[57]
heise.de, “Backbone-Ausfall bei Level 3” http://www.heise.de/newsticker/meldung/65202, 21.10.2005
[58]
NANOG mailing list, “Level3 problems”, http://www.merit.edu/mail.archives/nanog/2005-10/msg00970.html, 21.10.2005
[59]
NANOG mailing list, “Level 3 RFO”, http://www.merit.edu/mail.archives/nanog/2005-10/msg01034.html, 22.10.2005
[60]
heise.de, “Google-Geisterstunde: Nur eine DNS-Panne?” http://www.heise.de/newsticker/meldung/59375 08.05.2005
[61]
heise.de, “Satellitenausfall legt Telefonnetze im Südpazifik lahm”, http://www.heise.de/newsticker/meldung/55256, 18.01.2005
[62]
tse.edu, “Intelsat 804 – satellite fact sheet”, http://www.tse.edu/tse/online/sat_intelsat_804.html
[63]
intelsat.com, “Intelsat Reports Loss of IS-804 Satellite”, http://www.intelsat.com/_files/press_releases/intelsat/2005/2005-01.pdf, 16.01.2005
[64]
www.nzherald.co.nz, “Satellite link to Pacific Islands still down”, http://www.nzherald.co.nz/section/story.cfm?c_id=5&objectid=10007155, 19.01.2005
[65]
heise.de, “Software-Fehler legt Telefonnetz in Mittelhessen lahm”, http://www.heise.de/newsticker/meldung/53162, 11.11.2004
[66]
IT-News World.de, „Ganz Spanien für zwei Stunden offline?“ http://www.it-news-world.de/news_906/Ganz+Spanien+f\%FCr+zwei+Stunden+offline\%3F
[67]
Heise.de, „Spanien verschwand aus dem Web“ http://www.heise.de/newsticker/meldung/77478/
[68]
Heise.de, „GSM-Ausfall bei Tsunami-Übung“ http://www.heise.de/newsticker/meldung/73295
[69]
Heise.de, „Teilausfall am Internet-Knoten DE-CIX ohne gravierende Auswirkungen“ http://www.heise.de/newsticker/meldung/65007
[70]
Heise.de, „Überschwemmungen sorgen für Netzausfälle in Westösterreich“ http://www.heise.de/newsticker/meldung/63100
[71]
Wikipedia.de, „Murgang“ http://de.wikipedia.org/wiki/Mure
[72]
Heise.de, „DSL-Ausfall in der gesamten Schweiz“ http://www.heise.de/newsticker/meldung/58572
[73]
Heise.de, „Störung bei ISP-Service“ http://www.heise.de/newsticker/meldung/50337
[74]
Martin Fiutak, “Mehrstündiger T-Mobile-Netzausfall im Nordosten”, http://www.zdnet.de/news/tkomm/0,39023151,39120163,00.htm, 27.02.2004
[75]
heise.de, “T-Mobile-Netzausfall in Mecklenburg-Vorpommern und Nordbrandenburg”, http://www.heise.de/newsticker/meldung/45056, 27.02.2004
[76]
heise.de, “Komplettausfall bei Strato”, http://www.heise.de/newsticker/meldung/7354 22.12.1999
[77]
Frank Roselieb, “Der Online-GAU der Strato Medien AG - Ein Lehrstück für unzureichende Krisenkommunikation im Internet”, http://www.krisennavigator.de/akfo21-d.htm,
[78]
heise.de, “Beinahe-Blackout im Internet durch Unachtsamkeit”, http://www.heise.de/newsticker/meldung/1224 18.07.1997
[79]
Daniel Pouzzner in comp.risks (RISKS DIGEST 19.26), “Partial failure of Internet root nameservers”, http://groups.google.de/group/comp.risks/browse_frm/month/1997-07, 17.07.1997
[80]
John Markoff, “ Ignored Warning Leads to Chaos on the Internet”, http://query.nytimes.com/gst/fullpage.html?res=9507E3DC1F38F93BA25754C0A961958260&sec=technology&spon=&pagewanted=all, 18.07.1997
[81]
Peter G. Neumann in comp.risks (RISKS DIGEST 12.36), “AT&T phone failure downs three New York airports for four hours”, http://groups.google.de/group/comp.risks/browse_frm/month/1991-09, 18.09.1991
[82]
Edmund L. Andrews, “Breakdown Shows Tenuous Links in System”, http://select.nytimes.com/gst/abstract.html?res=F2061EF83D5F0C7B8DDDA00894D9494D81, 18.08.1991
[83]
Peter G. Neumann in comp.risks (Volume 10: Issue 75), “NY area fiber-optic telephone cable severed; extensive effects” http://groups.google.de/group/comp.risks/browse_frm/month/1991-01 18.09.1991
[84]
Tony Scandora in comp.risks (Volume 10: Issue 76) “Re: NY area fiber-optic telephone cable severed; extensive effects (PGN)” http://catless.ncl.ac.uk/Risks/10.76.html#subj5 08.01.1991
[85]
Computerhistory.org, “Computer History Museum - Exhibits - Internet History - 1980's”, http://www.computerhistory.org/exhibits/internet_history/internet_history_80s.shtml
[86]
Diskussion in der Newsgroup mod.protocols.tcp-ip, “Arpanet outage” http://groups.google.de/group/mod.protocols.tcp-ip/browse_frm/month/1986-12, Dezember 1986
[87]
Diskussion in der Mailing-Liste tcp-ip@sri-nic.arpa, “Arpanet outage” http://securitydigest.org/tcp-ip/archive/1986/12 Dezember 1986
[88]
ZDNet.co.uk, „Cable failure hits UK Internet traffic“ http://news.zdnet.co.uk/communications/0,1000000085,39118125,00.htm
[89]
TAT-14 Cable System, https://www.tat-14.com/tat14/index.jsp
[90]
Wikipedia.de, „TAT-14“ http://de.wikipedia.org/wiki/TAT-14
[91]
Spiegel.de, „Das fragile Netz“ http://www.spiegel.de/netzwelt/tech/0,1518,456682,00.html
[92]
tat-14.com, TAT-14 Landing ”StationMap“ https://www.tat-14.com/tat14/images/SprintMap1.jpeg
[93]
Thema in Newsgroup “alt.internet.providers.uk.aaisp”, “ TAT-14 failure”, http://groups.google.de/group/alt.internet.providers.uk.aaisp/browse_thread/thread/b522dac110265735/1b106387e6503866
[94]
Heise.de, „Bundesweiter Netzausfall bei E-Plus“ http://www.heise.de/newsticker/meldung/12786
[95]
Heise.de, „Kommunikationssatellit Intelsat Americas 7 ausgefallen“ http://www.heise.de/newsticker/meldung/53744
[96]
Intelsat, Satelliten-Netzwerk http://www.intelsat.com/network/satellite/
[97]
Heise.de, „Server-Ausfall bei T-Online“ http://www.heise.de/newsticker/meldung/1562

[98]
Heise.de, „America Online war offline“ http://www.heise.de/newsticker/meldung/582
[99]
comp.risks, RISKS DIGESR 18.30, „America Off-Line“ http://groups.google.de/group/comp.risks/browse_thread/thread/8486777fa1c28f57/a6a89497a8fecb6e?lnk=gst&q=aol+outage&rnum=2&hl=de#a6a89497a8fecb6e
[100]
comp.risks, RISKS DIGESR 18.31, „Re:America Off-Line“ http://groups.google.de/group/comp.risks/browse_thread/thread/8fd3d8a1aeca882/41353385a32e154e?lnk=gst&q=aol+outage&rnum=1&hl=de#41353385a32e154e
[101]
comp.risks, RISKS DIGEST 9.61, „Telephone malpractice?“, 16.01.1990 „AT&T Failure“, 17.01.1990 http://groups.google.com/group/comp.risks/tree/browse_frm/month/1990-01/f3e0cc96b88e6a03?rnum=1\&_done=\%2Fgroup\%2Fcomp.risks\%2Fbrowse_frm\%2Fmonth\%2F1990-01\%3F#doc_3c7ea6e975df1f87
[102]
comp.risks, RISKS DIGEST 9.62, „Cause of AT&T network failure“, 22.01.1990 http://groups.google.com/group/comp.risks/tree/browse_frm/month/1990-01/f3e0cc96b88e6a03?rnum=1\&_done=\%2Fgroup\%2Fcomp.risks\%2Fbrowse_frm\%2Fmonth\%2F1990-01\%3F#doc_214a77b0d7392211
[103]
comp.risks, RISKS DIGEST 12.02 „Bell Atlantic 26 June Failure“, 01.07.1991 http://groups.google.com/group/comp.risks/msg/db37b75a8c02690c?

This document was translated from LATEX by HEVEA.