Monthly Archive for Dezember, 2009

Cray T3E

Zwischen Weihnachten und Neujahr hatte ich mir vorgenommen, bei www.cray-cyber.org die Cray T3E in Betrieb zu nehmen. Gestern und vorgestern war es dann soweit. Am Montag angekommen, haben sich John und Benjamin bereits über die “kleine” T3E mit 28 PEs (entspricht 28 Alpha 21164 Prozessoren mit je 300 MHz) gestürzt und die Torus Verkabelung fertiggestellt. Blieb eigentlich nur noch die Clock Verkabelung übrig. Die dünnen fummeligen Kabel konnte man nur noch durch Verlöten miteinander verbinden. Danach kam der große Moment: Sicherung umlegen und die Start Prozedur einleiten. Ohne Handbuch bzw. eine genaue Anleitung wären wir vermutlich verzweifelt:

  • IO-Rack Hauptsicherung umlegen
  • Festplatten Arrays einschalten
  • IO-Server einschalten und warten bis er hochgefahren ist (Running)
  • Fibre Channel Controller (FCN1) Sicherung umlegen und warten bis die LEDs links und zweite von links alleine leuchten
  • T3E Cabinet #1 Ein/Ausschalter in der Türe  einschalten
  • T3E Cabinet #1 Hauptsicherung umlegen
  • T3E Cabinet #1 Blower, WACS, Clock-Board Sicherung prüfen
  • T3E Cabinet #1 Sicherungen pro PE Modul prüfen
  • T3E Cabinet #1 Remote Enable Schalter aktivieren

Das gleiche noch mal für das zweite Cabinet, mit Ausnahme Clock Board Sicherung, da lediglich im Cabinet #1 ein Clock Board installiert ist.

Danach muss man sich an der Admin Workstation (SWS) anmelden und

$ nwacsuser

ausführen, die zwei T3E Cabinets remote anwerfen (Power On) und beim Cabinet #1 die Schalter TKC => TKCS und Soft Scan => Enable setzen.

Danach

$ bootsys -c

ausführen.

Wir konnten es kaum fassen, aber die T3E bootete tatsächlich einen UNICOS Kernel !!! Doch das mounten des Root Dateisystems schlug fehl. Wir hatten vergessen die Festplatten zu installieren. Nun ging die Sucherei los. Wo sind die Platten dieser T3E ? Gesucht – gefunden, haben wir dann beschlossen die eiskalten Festplatten erst mal aufwärmen zu lassen.

Ausgeschlafen ging es am Dienstagmorgen frisch ans Werk. Die Festplatten wurden installiert und wir starteten die Maschine. Allerdings hagelte es beim Booten (bootsys) nach kurzer Zeit jede Menge Fehlermeldungen. Darauf waren wir gar nicht gefasst! Bei einem weiteren Versuch die T3E zu booten, hagelte es erneut Fehlermeldungen, aber diesmal andere als zuvor. Und so zog sich das bis etwa Mittag hin. Wir versuchten den Fehler einzukreisen und jedes Mal überraschte uns die T3E mit neuen Fehlermeldungen. Was für eine Katastrophe.

Mit etwas Glück klickten sich Benjamin und ich durch ein Diagnose Tool von Cray. Dabei starteten wir mehrfach ein Programm, welches Reinigungsmaßnahmen an der T3E vornahm. Irgendwann meldet dieses, dass alles in Ordnung sei. Prompt booteten wir die Maschine und wir konnten die T3E tatsächlich komplett hochfahren. Erleichterung machte sich breit. Allerdings hatte ich die Platten falsch eingehängt und so klemmte es im Init Prozess ordentlich. Wir beschlossen die Maschine nochmal per haltsys auszuschalten, die Platten umzuhängen und danach noch mal alles hochzufahren.

Leider war das erneute Hochfahren nicht von Erfolg gekrönt, es hagelte wieder Fehlermeldungen, bevor die Cray überhaupt mal einen Kernel laden konnte. Die Fehlersuche ging von vorne los.

Nach dem leckeren Essen beim Italiener, kam mir die Idee, einfach mal die sogenannte GigaRing Verkabelung durchzutauschen… ich hatte irgendwie Kabel im Verdacht. Auch diese Maßnahme führte nicht zum erhofften Erfolg. Allerdings war die Cray zwischenzeitlich so gnädig und versteifte sich auf exakt ein und dieselbe Fehlermeldung. John wälzte das Handbuch und mittels speziellen Diagnose Tools konnten wir dann das Problem mehr und mehr auf den GigaRing einschränken. Als ich dann wieder auf die alte GigaRing Verkabelung umschraubte, meldeten das GigaRing Diagnose Tool, dass alles in Ordnung ist! Aufgeregt wie kleine Kinder starteten wir wieder die T3E und sie bootete durch bis in den Multiuser Mode. Juhuuuuuuuuu Mission komplett – die T3E lebt ! :)

Fazit: Ich finde die T3E super spannend und sie ist zu allem Überfluss verdammt leise. Am liebsten würde ich mir eine ins Wohnzimmer stellen. :) Aber John will mir keine T3E abgeben. ;)

Zum Abschluß noch ein paar Impressionen von der Cray T3E:

Apple Wireless Desktop

Nach langem Warten ist heute endlich meine Apple Magic Mouse eingetroffen. :) In Verbindung mit dem Wireless Keyboard sieht das schon echt schick aus ! Allerdings hätte ich mir mehr Funktionalität gewünscht. Lediglich Scrollen und Vor-/Rückwärts per Fingergestik find ich jetzt nicht sooo wahnsinnig überzeugend. Und einen guten Zahn an Geschwindigkeit darf die Maus ruhig auch zulegen. Meine Zeigergeschwindigkeit ist bei 100% und alles andere als schnell. Mal schauen was die kommenden Treiber so mitsichbringen. Ansonsten bleib ich doch lieber wieder bei meiner Logitech Maus. ;)

wireless

Gedanken fest halten: Audi Sport Quattro S1

S wie Sturm statt Sport… Der Audi Sport Quattro S1 wenn er denn mal losgelassen wurde, war wie ein entfesselter Sturm. Also wenn ich mal gerne ein Auto fahren wollen würde, dann dieses Auto!

Schon als kleines Kind – Gott weiß warum – summte ich schon die Melodie des Fünfzylinders. Höchstwahrscheinlich ist mein Papa daran Schuld. Er schleppte mich immerhin im zarten Alter von 5 bis 10 Jahren gerne zu Auto-Cross Veranstaltungen. Noch heute rieche ich das Benzin, das Öl und der Audi 5-Zylinder Klang erklingt wie eh und je in meinen Ohren.

Mal schauen, die neuen Büchsen sind eh nicht so meins, womöglich wird mein nächstes Auto doch besser ein 5-Ender. :) :D

http://www.youtube.com/watch?v=7AQmgeMoM0A&feature=related

http://www.youtube.com/watch?v=XrhcSRktAs0&feature=related

NetApp clonen? ;)

Was tun wenn man 3 Stück Sun StorEdge 6020 Arrays (eigentlich 6 Stück. :D ) mit je 14 Stück 146 GB Fibre Channel Festplatten hat? Eigentlich klar, die Arrays konfigurieren und an das SAN klemmen. Tja, was ist aber wenn die installierten RAID Controller einfach nur grausam in der Bedienung sind, man maximal 2 Volumes pro Disk Array erstellen kann und die Geschwindigkeit mit ZFS einfach nur lausig ist?

Dumm in die Wäsche schauen? ;)

Ich habe versucht 4 Volumes (entspricht 2 Disk Arrays und 28 Platten) in diversen Konfigurationen (verschiedene Kombinationen aus Block Size, RAID-Level, etc.) passend für ZFS zu konfigurieren. Alle Ergebnisse waren ziemlich ernüchternd und der Weg dahin langwierig und schwierig.

Keine Lust mehr….

Die neue Idee war fix geboren. Ein StorEdge 6020/6120 kann auch zum Expansion Disk Array umgebaut werden, d.h. Controller ausbauen. Das riecht doch offensichtlich nach FC-AL. Für viel Geld hab ich mir also spezielle Kabel für die HSSDC2 Anschlüsse besorgt. Doch alle Versuche das 6020 als JBOD zu nutzen sind kläglich gescheitert.

Frust macht sich breit. :-/

Lange Zeit passierte nichts mehr und es schwirrte lediglich die Idee in meinem Kopf, die 42 Platten irgendwie in ein EMC CLARiiON CXx00 zu stecken. Nur ohne aktuelle Flares schwierige Sache. Hinzu kommt die Unsicherheit ob eine EMC CLARiiON die Platten überhaupt erkennt. Meine HP EVA tut es jedenfalls nicht so recht. Sie erkennte zwar die Platten, aber verweigert dessen Nutzung! Wieder einmal keimte der Gedanke JBOD auf. Aber woher ein JBOD nehmen? Fibre Channel JBODs sind halt alles andere als gängig. Was tun?

Ins kalte Wasser springen? ;)

Nach einigen Überlegungen und Recherchen sagte mir mein Bauch, NetApp macht doch eigentlich auch nichts anderes, als das was ich im Sinn habe? Die haben schlaue Software in ihren Filer Köpfen und brauchen doch eigentlich nur dumme JBODs mit vielen schnellen Platten, oder? Nachdem ich auch noch Verkabelungspläne für einen NetApp FAS3050 entdeckte, war ich mir immer sicherer, dass das NetApp DS14 mk2 Disk Enclosure ein dummes FC-AL JBOD sein muss. Lediglich die IO Module auf der Rückseite bereiteten mir kurzfristig Bauchschmerzen. Nach einigem hin und her entschloß ich mich für das sog. ESH2 Modul. Wie ich finde, eine gute Entscheidung. ;)

DSC03277

Aus UK habe ich mir dann für einen fairen Preis ein NetApp DS14 mk2 Disk Enclosure mit 2 Stück ESH2 Modulen besorgt. Frisch angekommen, habe ich das Enclosure mit 14 Platten aus einer meiner 6020 Arrays bestückt. In die Sun Fire X4100 hab ich einen Emulex FC HBA installiert und diesen direkt mit dem IO Modul verbunden. Das Ergebnis sieht so aus:

locadm@ius002:~$ pfexec luxadm probe
Found Fibre Channel device(s):
Node WWN:500000e010731c30  Device Type:Disk device
Logical Path:/dev/rdsk/c0t500000E010731C30d0s2
Node WWN:2000000087014896  Device Type:Disk device
Logical Path:/dev/rdsk/c0t2000000087014896d0s2
Node WWN:500000e010730550  Device Type:Disk device
Logical Path:/dev/rdsk/c0t500000E010730550d0s2
Node WWN:2000000c509a551e  Device Type:Disk device
Logical Path:/dev/rdsk/c0t2000000C509A551Ed0s2
Node WWN:2000000c509a5621  Device Type:Disk device
Logical Path:/dev/rdsk/c0t2000000C509A5621d0s2
Node WWN:500000e0107325c0  Device Type:Disk device
Logical Path:/dev/rdsk/c0t500000E0107325C0d0s2
Node WWN:20000000871a4524  Device Type:Disk device
Logical Path:/dev/rdsk/c0t20000000871A4524d0s2
Node WWN:2000000c509a553f  Device Type:Disk device
Logical Path:/dev/rdsk/c0t2000000C509A553Fd0s2
Node WWN:500000e0107323e0  Device Type:Disk device
Logical Path:/dev/rdsk/c0t500000E0107323E0d0s2
Node WWN:2000000c509a4f64  Device Type:Disk device
Logical Path:/dev/rdsk/c0t2000000C509A4F64d0s2
Node WWN:500000e010730b90  Device Type:Disk device
Logical Path:/dev/rdsk/c0t500000E010730B90d0s2
Node WWN:20000000871ae23b  Device Type:Disk device
Logical Path:/dev/rdsk/c0t20000000871AE23Bd0s2
Node WWN:2000000c50860c5d  Device Type:Disk device
Logical Path:/dev/rdsk/c0t2000000C50860C5Dd0s2
Node WWN:500000e0107311b0  Device Type:Disk device
Logical Path:/dev/rdsk/c0t500000E0107311B0d0s2

Ein paar Tests belegen mir eine Schreibgeschwindigkeit von durchschnittlich 140 MByte/Sek. und eine Lesegeschwindigkeit von 210 MByte/Sek. Cool ! Es wird Zeit für 3 weitere NetApp DS14 mk2 Disk Enclosures. ;) Die neue Idee ist geboren und schimpft sich:

“NoNapp Data ONZFS”

:D :D :D

Alles weitere demnächst hier in diesem Kino. ;)