Navigationshilfe

Hauptnavigation

Seiteninhalt

Der LOEWE-CSC Hochleistungsrechner

Der LOEWE-CSC ist ein heterogener Hochleistungsrechner der Goethe Universität Frankfurt, der im Spätjahr 2010 im Industriepark Höchst installiert wurde. Abgesehen von speziellen Knoten für Logins, Massenspeicher, etc. stehen 768 Rechenknoten mit je zwei 12-Kern AMD Prozessoren und einer GPU zur Verfügung. Für hochparallele, CPU-intensive Anwendungsn stehen darüber hinaus 40 Knoten mit je vier der oben genannten Prozessoren bereit.

Anwendungen

Der LOEWE-CSC wurde designed um ein breites Spektrum von Anwendungen aus multiplen Gebieten auszuführen, darunter Lattice-QCD, Hydrodynamik, UrQMD, Datenauswertung in der Hochenergie-Physik (z.b. Spurrekonstruktion) etc.

Rechenleistung

Die Prozessoren takten mit je 2,1 GHz womit die Rechenknoten eine Gesamtperformance von 162,9 TFlop/s in doppelter Rechengenauigkeit bieten. Die Grafikkarten der Cypress-Architektur stellen eine Gesamtleistung von 417,8 TFlop/s bereit. In einfacher genauigkeit steigt die CPU-Leistung um einen Faktor zwei, die GPU Leistung sogar um einen Faktor 5. Viele Algorithmen bieten die Möglichkeit einen Großteil der Rechnungen einfach genau durchzuführen und erfordern doppelte Genauigkeit nur für einen kleinen kritischen Teil. Um die bereitgestellte Leistung voll auszuschöpfen, ist hoch optimierte Software vonnöten, die Parallellisierung, Vektorisierung und GPU-Programmierung beinhaltet. Daher arbeiten die Anwender des Computers eng mit Spezialisten auf diesem Gebiet zusammen.

Zur Demonstration, dass es durchaus möglich ist, die Leistung der heterogenen Architektur auszuschöpfen, wurde ein DGEMM (Verallgemeinerte Matrix-Multiplikation) programmiert, der sowohl GPU als auch CPU voll auslasten kann. Der GPU Kernel selbst erreicht über 90% der theoretischen Spitzenperformance. Im System stehen weit über 80% der theoretischen akkumulierten Leistung von GPU und CPU zur Verfügung; den DMA transfer miteingerechnet. (CALDGEMM Quellcode und Dokumentation)

Auf Basis dieses DGEMMs wurde der HPL Benchmark angepasst. HPL ist eine implementierung von Linpack, welcher der Standardbenchmark für Hochleistungscomputer ist. Um die GPU-Leistung voll auszunutzen, wurde eine spezielle Methode implementiert, die Transferzeiten fast vollständig zu verstecken. Ein paralleler Linpack Lauf auf mehreren hundert GPU-Knoten erreicht ca. 70% der theoretischen Maximalleistung. Dies übertrifft herkömliche heterogene Hochleistungsrechner bei weitem, die oft nur 50% erreichen. Der LOEWE-CSC erreichte den 22. Platz der Top500 Liste der Supercomputer im November 2011. (GPU-HPL Quellcode und Dokumentation)

Energieeffizienz

Im Gegensatz zu herkömmlichen Rechenzentren, die zum Teil bis zu 50% ihres Energiebedarfs für die Kühlung aufwenden, genügen dem LOEWE-CSC hierfür weniger als 10% (PUE < 1.1). Dies wird durch ein neuartiges Kühlkonzept ermöglicht. Die Racks selbst haben in der Rücktür einen Wärmetauscher für eine Wasserkühlung. Es sind keine zusätzlichen Lüfter erforderlich. Stattdessen erzeugen die Computer selbst genügend Luftdruck um einen ausreichenden Luftstrom durch die Wärmetauscher zu gewährleisten. Zwei große Kühlagregate im freien kühlen das Wasser, wobei das zweite Agregat nur im Hochsommer zugeschaltet werden muss.

Die erforderliche Kühlleistung wird weiter reduziert, indem relativ Warmes Kühlwasser verwendet wird. Dies erhöht den Wirkungsgrad der Kühlagregate beträchtlich. Die Computer wurden so designed, dass sie auch mit erhöhter Umgebungstemperatur arbeiten können.

Auch die Server selbst stellen eine extrem hoche Leistung pro verbrauchter Energie bereit. Dies wird insbesondere durch den Einsatz der Grafikkarten erreicht. Unter Verwendung des oben beschriebenen Linpack Benchmarks erreichte der LOEWE-CSC Platz 8 auf der Green500 Liste im November 2010.

Aktuelle Leistungsaufnahme: N/A

Zur Navigationshilfe
empty

Seitenabschlussleiste