Inhalt

Ankündigungen
Neuigkeiten
·Archiv 2011
·Archiv 2010
·Archiv 2009
RBG
Dienstleistungen
GZI
Rechnernutzung
MitarbeiterInnen
Nützliche Links


Neues aus der RBG

Aktuelle Meldungen aus der RBG. Außerdem gibt jemand jede Woche eine blog-ähnliche Zusammenfassung über diejenigen Ereignisse, die außerhalb des täglichen 10-stündigen Tagesgeschäfts erwähnenswert sind ;-)

Hardwareschaden Netzwerk / Hinweis zu den VoIP-Telefonen 16. Mai 2013
Im TechFak-Netzwerk lag heute von 14:30 bis 15:00 eine Störung durch einen Hardwareschaden vor. Während dieser Zeit waren auch die VoIP-Telefone nicht benutzbar, da diese prinzipbedingt ohne Netzwerk nicht funktionieren. Bitte überprüfen Sie, ob Ihre Telefone nach der Störung ihre Betriebsbereitschaft wieder automatisch hergestellt haben. Manchmal kommt es nach einer Netzwerkstörung vor, daß einzelne Telefone im Zustand "Gerät nicht registriert" hängenbleiben. Die entsprechenden Teilnehmer sind dann telefonisch nicht mehr erreichbar. Wenn Sie diesen Zustand feststellen, hilft ein Neustart des Telefons, indem Sie es durch Herausziehen des Netzwerkkabels kurz vom Strom trennen.

 
Migration auf neue Netzwerkinfrastruktur im UHG fast abgeschlossen 14. Dezember 2012
Derzeit läuft die Erneuerung der Netzwerkinfrastruktur im UHG. Alle älteren Switche werden durch aktuelle Modelle ersetzt. Dies war nötig, da zum einen die Hardware bereits acht Jahre oder älter war und zum anderen, damit wir auf die neuen VoIP-Telefone umstellen können.
Außerdem stellen wir alle Ports um, so dass ein Zugang zum Netzerk nur nach Authentifizierung möglich ist. Hier kommt der Standard IEEE-802.1 zum tragen. Zum einen erhöht diese Maßnahme die IT-Sicherheit, weil eine unberechtigte Person ohne Anmeldung keinen Zugriff bekommt, und zum anderen erhalten die Nutzer so mehr Flexibilität. Wurden bisher den Netzwerkdosen ein Netz (VLAN) fest zugewiesen und nur für einen bestimmten Rechner konfiguriert, so fällt diese Einschränkung ab jetzt weg: die Zuweisung des Netzes erfolgt nun nach dem authentifzierenden Host oder Benutzer dynamisch. Rechnerumzüge müssen in den umgestellten Bereichen nicht mehr angemeldet werden und jede Netzwerkdose kann für jeden beliebigen Host genutzt werden. Hosts oder Geräte, die keine 802.1x-Authentifizierung mittels EAP unterstützen, können können über zwei andere Wege trozdem genutzt werden: zum einen kann eine Authentifizierung mittels MAC-Adresse passieren (nur für Netze mit geringen Sicherheitsanforderungen, wie z.B. das Druckernetz) oder eine Authentifizierung findet durch die MAC-Adresse und dem Switchport statt. Bei letzterer Methode wird der Netzzugriff nur erlaubt, wenn die passende MAC-Adresse an der für dieses Gerät registrierten Netzwerkdose angeschlossen wird. Dies entspricht weitgehend dem früheren Konzept, nur wird die Berechtigung nun über den RADIUS-Server gesteuert und nicht mehr über eine Konfigurationsänderung auf dem Switch, was das Management für uns deutlcih vereinfacht. Für beide Alternativen muss der Client keine besonderen Fähigkeiten (EAP-Unterstützung) mitbringen.
Bitte beachten Sie, dass wir die Alternativen zur EAP-Authentifizierung nur anbieten, wenn das eingesetzte Gerät diese nicht unterstützt.

Informationen, wie man als Endnutzer private Geräte, wie Laptops, in unser Netz einbindet, sind hier zu finden: Netzwerkzugang auf dem Client mit 802.1x einrichten.
 
Netboot: Ubuntu Precise Pangolin verfügbar 01. August 2012
Die aktuelle Ubuntu-Version "Precise Pangolin" steht ab sofort für unser Netboot-System zur Verfügung. Neben den vielen Änderungen, die Ubuntu seit der letzten bei uns eingesetzten Version "Lucid Lynx" mitbringt, gibt es dieses Mal auch viele Änderungen an unserem Netboot-System. Unser Netboot-System wurde von Grund auf neugeschrieben. Bisher bekamen alle Rechner ein per NFS verteiltes Read-Only-Image mit einem schreibbaren Overlay (unionfs, aufs) als Root-Filesystem. Dieses Konzept funktionierte trotz mehr als 500 Clients und nur zwei Servern stets zuverlässig und einigermaßen performant (natürlich nicht vergleichbar mit der Geschwindigkeit aktueller Festplatten). Es war der Overlay-Mechnismus (aufs), der uns immer mehr Probleme machte. Aufs wurde ursprünglich für Live-CDs entwickelt. Ziel dieses virtuellen Dateisystems ist es, einen nicht schreibbaren Datenträger dennoch beschreiben zu können. Dabei wird über das nicht schreibbare Dateisystem ein anfangs leeres, aber schreibbares Dateisystem drübergelegt (daher Overlay). Wird eine Datei gelesen, so wird auf das schreibgeschützte Dateisystem zugegriffen. Bei Schreibzugriffen wird eine Kopie der Datei in dem schreibbaren Dateisystem angelegt. Das schreibbare Dateisystem enthält somit nur die geänderten Daten.
Aufs war niemals dafür ausgelegt, dass sich das schreibgeschützte Dateisystem im Betrieb verändert. Schließlich wird so etwas bei einer Live-CD auch nicht passieren. Gerade dieser Umstand machte uns große Schwierigkeiten, denn so müssen wir hin und wieder mal Updates installieren und Paketwünschen gehen wir in der Regel auch nach. In älteren Versionen von aufs funktionierte das auch, aber das System wurde immer weiter optimiert und hinzugekommende Pufferfunktionen machen es für unseren Zweck unbrauchbar. Der Client speichert häufig zugegriffende Dateien im Hauptspeicher zwischen. Wird ein Update eingespielt, so kann es vorkommen, dass ein Teil der Daten noch vor dem Update zwischengespeichert wurde und ein anderer Teil nicht. So kam es immer wieder zu Inkonsistenzen und Abstürzen.
Zudem war die Performance nicht mehr zeitgemäß. Rechner, die nur mit 100 MBit/s versorgt werden können, brauchen fast 5 Minuten zum hochfahren.
Unser neues System verfolgt einen komplett anderen Ansatz: statt das Filesystem live aus dem Netzwerk zu beziehen, syncronisiert der Client sein System auf die lokale Festplatte. Dabei gehen die Vorteile des Netboots nicht verloren: es gibt weiterhin ein einheitliches System, das zentral administriert wird, Updates erhält und wo wir Pakete für unsere Nutzer einspielen. Durch die Nutzung der lokalen Festplatte ergeben sich einige Vorteile: so ist die Performance deutlich besser und das System läuft auch bei einem Ausfall des Netboot-Servers ohne Beeinträchtigung weiter.
Dabei läuft der komplizierte Bootvorgang in etwa so ab:
Der Rechner bootet mittels PXE-Boot ein kleines Hilfssystem, das Netboot eXecution Environemnt (NXE). Dieses ist nur etwa 300 MiB groß und arbeitet in einer RAM-Disk. Das NXE lädt Konfigurationsdateien von dem Server, entschlüsselt diese, syncronisiert das Image auf der Festplatte mit der aktuellen Version auf dem Server und startet dann das gewüschte Ubuntu direkt ohne den Rechner neuzustarten.

Eine FAQ zu dem neuen System ist auf unserer Homepage einzusehen: Netboot-FAQ

Die Rechnerbeauftragten können ab sofort Maschinen zum Testen des neuen Netboots anmelden.
(sf)
 
Vorbereitungen für die Modernisierung der IT-Infrastruktur laufen an 19. April 2012
Fer Forschungsbau Intelligente Interaktive Systeme wird in diesem Jahr nicht nur Platz für neue Büros und Labore schaffen, sondern auch die neue Heimat für den Großteil der IT-Infrastruktur von CIT-EC, TechFak und CoR-Lab werden.
Dazu entstehen im Untergeschoss des Neubaus zwei Nachrichtentechnikräume, die eine redundante Anbindung des Gebäudes an das Universitätshauptgebäude mittels Glasfaserkabel erlauben und den neuen Kern unserer IT-Infrastruktur aufnehmen werden. Dieser redundante "Backbone" besteht aus zwei Geräten, damit ein Ausfall einer Komponente den Netzwerkbetrieb nicht komplett lahmlegt, sondern nur die maximal zur Verfügung stehende Bandbreite und Performanz verringert.
Im Backbone werden zwei Cisco Nexus 7010 Switche zum Einsatz kommen. Diese können bis zu acht Linecards mit jeweils bis zu 48 10 GBit/s-Ports aufnehmen. Die Fabric bietet für jeden Slot eine Bandbreite von 550 GBit/s (also insgesamt 4,4 Terabits pro Sekunde!), so dass das mittlere 10-Slot-Chassis mit bis zu 384 Non-Blocking 10 GBit/s ausgestattet werden könnte.
Aber auch die IT-Infrastruktur im Hauptgebäude wird erneuert: viele der größeren Bereiche der TechFak haben bereits neue Switche bekommen. Die restlichen Standorte folgen in den nächsten Wochen. Alle Switche im Access-Layer im UHG werden redundant mit 20 GBit/s angebunden. Die Anbindung des UHG an das FBIIS wird mit insgesamt 80 GBit/s erfolgen.
Im FBIIS wird es erstmals möglich sein, auch Workstations oder Labor-Equipment mit 10 GBit/s zu versorgen. Für den Laborbereich werden dazu eine kleine Anzahl (48-64 Stück) von 10 GBit/s-Ports zur Verfügung stehen.
Außerdem entsteht ein neues Datacenter, welches mehr Platz und ausreichende Kühlleistung für eine größere Anzahl von Servern bietet. Statt der klassichen Verkabelung (Patchkabel von den Servern werden zu einem zentralen Switch verlegt), werden wir dort mit ToR-Switchen (Top of Rack) arbeiten. Dabei wird jeder Serverschrank mit einem kleinen (1 HE) Switch ausgestattet, der die Server in diesem Schrank anbindet. Die einzelnen Schränke werden dann über Glasfaserkabel an zwei zentrale "Parentswitche" an das Netzwerk angebunden. Dies reduziert den Verkabelungsaufwand enorm, da nicht hunderte von starren Cat-6-Patchkabeln über Kabeltrassen von allen Serverschränken zu einem zentralen Netzwerkschrank verlegt werden müssen.
Damit der Aufwand für das Management überschaubar bleibt, arbeiten wir dabei nicht mit autonomen Switchen, sondern nutzen die Fabric-Extender-Technologie (FEX) von Cisco.
Zwei Cisco Nexus 5596UP bieten genug 10 GBit/s-Ports für die Anbindung von bandbreitenintensiven Anwendungen (Fileserver-Cluster, Netboot-Server, usw.). Die meisten Server werden mit 1 GBit/s an jeweils eine oder zwei Nexus 2248 Fabric-Extender angeschlossen. Diese 1 HE hohen Geräte kann man sich als Linecard für einen modularen Switch vorstellen. Nur werden diese nicht nicht in ein zentrales Chassis montiert, sondern über Glasfaserkabel (10 GBit/s) an die beiden Nexus 5596 angeschlossen. Die Fabric-Extender selbst sind nicht managebar, denn deren Ports werden über ihre Partent-Switche verwaltet. Statt 17 einzelne Switche müssen somit nur zwei verwaltet werden.
Unser momentan noch aktuelles Datacenter wird dann zum zweiten Standort umgebaut. Dort werden alle wichtigen Dienste und Daten repliziert, so dass bei einem Ausfall des Haupt-Datacenters die wichtigsten Dienste erreichbar bleiben.
(sf)
 
Kurzzeitiger Netzausfall heute morgen 18. Januar 2012
Der zentrale Netzwerkrouter der Technischen Fakultät war heute morgen ausgefallen.
Dies hatte zur Folge, dass interne und externe Dienste während dieser Zeit nicht erreichbar waren. Grund für den Komplettausfall war ein Softwarecrash auf dem Gerät.
In ein paar Monaten werden wir zum Glück diesen wichtigen Knotenpunkt gegen eine redundante Konfiguration austauschen, damit derartige Ausfälle keine Beeinträchtigung des Produktivbetriebes zur Folge haben.
Möglich wird dies durch den Forschungsneubau. Ein Großteil der IT wird dann in das neue Datacenter umziehen und die Kerninfrastruktur wird damit erneuert.
(sf)
 
Fileserverstörungen in den letzten Monaten 18. Januar 2012
Seit November letzten Jahres haben wir immer wieder mit Problemen unserer Fileserver zu kämpfen.
Wir beobachten überdurchschnittlich viele Ausfälle von Festplatten und RAID-Controllern. Teilweise fallen drei bis vier - bis dahin laut Diagnosedaten völlig unauffällige - Festplatten an einem Tag aus. Auch drei Ausfälle von RAID-Controllern hatten wir in den letzten Woche zu verbuchen. Leider ist dabei teilweise Datenverlust aufgetreten, so dass wir einige Daten aus dem Backup restaurieren mussten.
Ob ein direkter Zusammenhang mit einem vorigen Teilausfall der Kühlung in unserem Datacenter besteht, können wir nicht mit Sicherheit sagen.

Da leider ein vorsorglicher Austausch aller betroffen Festplatten und RAID-Controller zu kostspielig ist, können wir nur versuchen drohende Ausfälle möglichst früh Vorherzusagen und ggf. durch Komponententausch zu verhindern. Wir haben dazu unser Ersatzteillager aufgestockt.
(sf)
 
© 2011-2012 Universität Bielefeld       Verantwortliche Person: Dr. C. Gnörlich       Impressum