|
|
|
Neues aus der RBG
Aktuelle Meldungen aus der RBG. Außerdem gibt jemand jede
Woche eine blog-ähnliche Zusammenfassung über diejenigen
Ereignisse, die außerhalb des täglichen 10-stündigen
Tagesgeschäfts erwähnenswert sind ;-)
| Hardwareschaden Netzwerk / Hinweis zu den VoIP-Telefonen |
16. Mai 2013 |
|
Im TechFak-Netzwerk lag heute von 14:30 bis 15:00 eine Störung durch einen Hardwareschaden
vor. Während dieser Zeit waren auch die VoIP-Telefone nicht benutzbar, da diese
prinzipbedingt ohne Netzwerk nicht funktionieren. Bitte überprüfen Sie, ob Ihre Telefone
nach der Störung ihre Betriebsbereitschaft wieder automatisch hergestellt haben.
Manchmal kommt es nach einer Netzwerkstörung vor,
daß einzelne Telefone im Zustand "Gerät nicht registriert" hängenbleiben.
Die entsprechenden Teilnehmer sind dann telefonisch nicht mehr erreichbar.
Wenn Sie diesen Zustand feststellen,
hilft ein Neustart des Telefons, indem Sie es durch Herausziehen des Netzwerkkabels kurz
vom Strom trennen.
|
| Migration auf neue Netzwerkinfrastruktur im UHG fast abgeschlossen |
14. Dezember 2012 |
![]() |
![]() |
Derzeit läuft die Erneuerung der Netzwerkinfrastruktur im UHG. Alle älteren Switche werden durch
aktuelle Modelle ersetzt. Dies war nötig, da zum einen die Hardware bereits acht Jahre oder
älter war und zum anderen, damit wir auf die neuen VoIP-Telefone umstellen können.
Außerdem stellen wir alle Ports um, so dass ein Zugang zum Netzerk nur nach Authentifizierung
möglich ist. Hier kommt der Standard IEEE-802.1 zum tragen. Zum einen erhöht diese Maßnahme die
IT-Sicherheit, weil eine unberechtigte Person ohne Anmeldung keinen Zugriff bekommt, und zum anderen
erhalten die Nutzer so mehr Flexibilität. Wurden bisher den Netzwerkdosen ein Netz (VLAN) fest
zugewiesen und nur für einen bestimmten Rechner konfiguriert, so fällt diese Einschränkung ab jetzt
weg: die Zuweisung des Netzes erfolgt nun nach dem authentifzierenden Host oder Benutzer dynamisch.
Rechnerumzüge müssen in den umgestellten Bereichen nicht mehr angemeldet werden und jede Netzwerkdose
kann für jeden beliebigen Host genutzt werden. Hosts oder Geräte, die keine 802.1x-Authentifizierung
mittels EAP unterstützen, können können über zwei andere Wege trozdem genutzt werden: zum einen
kann eine Authentifizierung mittels MAC-Adresse passieren (nur für Netze mit geringen
Sicherheitsanforderungen, wie z.B. das Druckernetz) oder eine Authentifizierung findet durch die
MAC-Adresse und dem Switchport statt. Bei letzterer Methode wird der Netzzugriff nur erlaubt, wenn
die passende MAC-Adresse an der für dieses Gerät registrierten Netzwerkdose angeschlossen wird.
Dies entspricht weitgehend dem früheren Konzept, nur wird die Berechtigung nun über den RADIUS-Server
gesteuert und nicht mehr über eine Konfigurationsänderung auf dem Switch, was das Management für uns
deutlcih vereinfacht. Für beide Alternativen muss der Client keine besonderen Fähigkeiten
(EAP-Unterstützung) mitbringen.
Bitte beachten Sie, dass wir die Alternativen zur EAP-Authentifizierung nur anbieten, wenn das
eingesetzte Gerät diese nicht unterstützt.
Informationen, wie man als Endnutzer private Geräte, wie Laptops, in unser Netz einbindet, sind hier
zu finden: Netzwerkzugang auf dem Client mit 802.1x einrichten.
|
| Netboot: Ubuntu Precise Pangolin verfügbar |
01. August 2012 |
![]() |
![]() |
Die aktuelle Ubuntu-Version "Precise Pangolin" steht ab sofort für unser Netboot-System zur
Verfügung. Neben den vielen Änderungen, die Ubuntu seit der letzten bei uns eingesetzten
Version "Lucid Lynx" mitbringt, gibt es dieses Mal auch viele Änderungen an unserem
Netboot-System. Unser Netboot-System wurde von Grund auf neugeschrieben. Bisher bekamen alle
Rechner ein per NFS verteiltes Read-Only-Image mit einem schreibbaren Overlay (unionfs, aufs) als
Root-Filesystem. Dieses Konzept funktionierte trotz mehr als 500 Clients und nur zwei Servern
stets zuverlässig und einigermaßen performant (natürlich nicht vergleichbar mit der
Geschwindigkeit aktueller Festplatten). Es war der Overlay-Mechnismus (aufs), der uns
immer mehr Probleme machte. Aufs wurde ursprünglich für Live-CDs entwickelt. Ziel dieses
virtuellen Dateisystems ist es, einen nicht schreibbaren Datenträger dennoch beschreiben
zu können. Dabei wird über das nicht schreibbare Dateisystem ein anfangs leeres, aber
schreibbares Dateisystem drübergelegt (daher Overlay). Wird eine Datei gelesen, so wird
auf das schreibgeschützte Dateisystem zugegriffen. Bei Schreibzugriffen wird eine Kopie der
Datei in dem schreibbaren Dateisystem angelegt. Das schreibbare Dateisystem enthält somit nur die
geänderten Daten.
Aufs war niemals dafür ausgelegt, dass sich das schreibgeschützte Dateisystem im Betrieb verändert.
Schließlich wird so etwas bei einer Live-CD auch nicht passieren. Gerade dieser Umstand machte uns
große Schwierigkeiten, denn so müssen wir hin und wieder mal Updates installieren und Paketwünschen
gehen wir in der Regel auch nach. In älteren Versionen von aufs funktionierte das auch, aber
das System wurde immer weiter optimiert und hinzugekommende Pufferfunktionen machen es für unseren
Zweck unbrauchbar. Der Client speichert häufig zugegriffende Dateien im Hauptspeicher zwischen.
Wird ein Update eingespielt, so kann es vorkommen, dass ein Teil der Daten noch vor dem Update
zwischengespeichert wurde und ein anderer Teil nicht. So kam es immer wieder zu Inkonsistenzen
und Abstürzen.
Zudem war die Performance nicht mehr zeitgemäß. Rechner, die nur mit 100 MBit/s versorgt werden
können, brauchen fast 5 Minuten zum hochfahren.
Unser neues System verfolgt einen komplett anderen Ansatz: statt das Filesystem live aus dem
Netzwerk zu beziehen, syncronisiert der Client sein System auf die lokale Festplatte.
Dabei gehen die Vorteile des Netboots nicht verloren: es gibt weiterhin ein einheitliches System, das
zentral administriert wird, Updates erhält und wo wir Pakete für unsere Nutzer einspielen.
Durch die Nutzung der lokalen Festplatte ergeben sich einige Vorteile: so ist die Performance
deutlich besser und das System läuft auch bei einem Ausfall des Netboot-Servers ohne Beeinträchtigung
weiter.
Dabei läuft der komplizierte Bootvorgang in etwa so ab:
Der Rechner bootet mittels PXE-Boot ein kleines Hilfssystem, das Netboot eXecution Environemnt (NXE).
Dieses ist nur etwa 300 MiB groß und arbeitet in einer RAM-Disk. Das NXE lädt Konfigurationsdateien
von dem Server, entschlüsselt diese, syncronisiert das Image auf der Festplatte mit der aktuellen
Version auf dem Server und startet dann das gewüschte Ubuntu direkt ohne den Rechner neuzustarten.
Eine FAQ zu dem neuen System ist auf unserer Homepage einzusehen: Netboot-FAQ
Die Rechnerbeauftragten können ab sofort Maschinen zum Testen des neuen Netboots anmelden.
(sf)
|
| Vorbereitungen für die Modernisierung der IT-Infrastruktur laufen an |
19. April 2012 |
![]() |
![]() |
Fer Forschungsbau Intelligente Interaktive Systeme wird in diesem Jahr nicht nur Platz für neue
Büros und Labore schaffen, sondern auch die neue Heimat für den Großteil der IT-Infrastruktur von
CIT-EC, TechFak und CoR-Lab werden.
Dazu entstehen im Untergeschoss des Neubaus zwei Nachrichtentechnikräume, die eine redundante Anbindung
des Gebäudes an das Universitätshauptgebäude mittels Glasfaserkabel erlauben und den neuen Kern unserer
IT-Infrastruktur aufnehmen werden. Dieser redundante "Backbone" besteht aus zwei Geräten, damit ein
Ausfall einer Komponente den Netzwerkbetrieb nicht komplett lahmlegt, sondern nur die maximal zur
Verfügung stehende Bandbreite und Performanz verringert.
Im Backbone werden zwei Cisco Nexus 7010 Switche zum Einsatz kommen. Diese können bis zu acht Linecards
mit jeweils bis zu 48 10 GBit/s-Ports aufnehmen. Die Fabric bietet für jeden Slot eine Bandbreite
von 550 GBit/s (also insgesamt 4,4 Terabits pro Sekunde!), so dass das mittlere 10-Slot-Chassis mit
bis zu 384 Non-Blocking 10 GBit/s ausgestattet werden könnte.
Aber auch die IT-Infrastruktur im Hauptgebäude wird erneuert: viele der größeren Bereiche der
TechFak haben bereits neue Switche bekommen. Die restlichen Standorte folgen in den nächsten Wochen.
Alle Switche im Access-Layer im UHG werden redundant mit 20 GBit/s angebunden. Die Anbindung des
UHG an das FBIIS wird mit insgesamt 80 GBit/s erfolgen.
Im FBIIS wird es erstmals möglich sein, auch Workstations oder Labor-Equipment mit 10 GBit/s zu
versorgen. Für den Laborbereich werden dazu eine kleine Anzahl (48-64 Stück) von 10 GBit/s-Ports
zur Verfügung stehen.
Außerdem entsteht ein neues Datacenter, welches mehr Platz und ausreichende Kühlleistung für eine
größere Anzahl von Servern bietet. Statt der klassichen Verkabelung (Patchkabel von den Servern werden
zu einem zentralen Switch verlegt), werden wir dort mit ToR-Switchen (Top of Rack) arbeiten.
Dabei wird jeder Serverschrank mit einem kleinen (1 HE) Switch ausgestattet, der die Server in
diesem Schrank anbindet. Die einzelnen Schränke werden dann über Glasfaserkabel an zwei zentrale
"Parentswitche" an das Netzwerk angebunden. Dies reduziert den Verkabelungsaufwand enorm, da nicht
hunderte von starren Cat-6-Patchkabeln über Kabeltrassen von allen Serverschränken zu einem zentralen
Netzwerkschrank verlegt werden müssen.
Damit der Aufwand für das Management überschaubar bleibt, arbeiten wir dabei nicht mit autonomen
Switchen, sondern nutzen die Fabric-Extender-Technologie (FEX) von Cisco.
Zwei Cisco Nexus 5596UP bieten genug 10 GBit/s-Ports für die Anbindung von bandbreitenintensiven
Anwendungen (Fileserver-Cluster, Netboot-Server, usw.). Die meisten Server werden mit
1 GBit/s an jeweils eine oder zwei Nexus 2248 Fabric-Extender angeschlossen. Diese 1 HE hohen
Geräte kann man sich als Linecard für einen modularen Switch vorstellen. Nur werden diese nicht
nicht in ein zentrales Chassis montiert, sondern über Glasfaserkabel (10 GBit/s) an die beiden
Nexus 5596 angeschlossen. Die Fabric-Extender selbst sind nicht managebar, denn deren Ports
werden über ihre Partent-Switche verwaltet. Statt 17 einzelne Switche müssen somit nur zwei
verwaltet werden.
Unser momentan noch aktuelles Datacenter wird dann zum zweiten Standort umgebaut. Dort werden
alle wichtigen Dienste und Daten repliziert, so dass bei einem Ausfall des Haupt-Datacenters die
wichtigsten Dienste erreichbar bleiben.
(sf)
|
| Kurzzeitiger Netzausfall heute morgen |
18. Januar 2012 |
Der zentrale Netzwerkrouter der Technischen Fakultät war heute morgen ausgefallen.
Dies hatte zur Folge, dass interne und externe Dienste während dieser Zeit nicht
erreichbar waren. Grund für den Komplettausfall war ein Softwarecrash auf dem Gerät.
In ein paar Monaten werden wir zum Glück diesen wichtigen Knotenpunkt gegen eine
redundante Konfiguration austauschen, damit derartige Ausfälle keine Beeinträchtigung
des Produktivbetriebes zur Folge haben.
Möglich wird dies durch den Forschungsneubau. Ein Großteil der IT wird dann in das
neue Datacenter umziehen und die Kerninfrastruktur wird damit erneuert.
(sf)
|
| Fileserverstörungen in den letzten Monaten |
18. Januar 2012 |
Seit November letzten Jahres haben wir immer wieder mit Problemen unserer Fileserver
zu kämpfen.
Wir beobachten überdurchschnittlich viele Ausfälle von Festplatten und RAID-Controllern.
Teilweise fallen drei bis vier - bis dahin laut Diagnosedaten völlig unauffällige -
Festplatten an einem Tag aus. Auch drei Ausfälle von RAID-Controllern hatten wir in
den letzten Woche zu verbuchen. Leider ist dabei teilweise Datenverlust aufgetreten, so
dass wir einige Daten aus dem Backup restaurieren mussten.
Ob ein direkter Zusammenhang mit einem vorigen Teilausfall der Kühlung in unserem Datacenter
besteht, können wir nicht mit Sicherheit sagen.
Da leider ein vorsorglicher Austausch aller betroffen Festplatten und RAID-Controller
zu kostspielig ist, können wir nur versuchen drohende Ausfälle möglichst früh Vorherzusagen
und ggf. durch Komponententausch zu verhindern. Wir haben dazu unser Ersatzteillager
aufgestockt.
(sf)
|
|