Leistungsfähigkeit der 2D-Modellierung steigern

Mit Grafik-Prozessoren (GPU) können Sie die Performance Ihrer Rechner deutlich steigern. Die Version HYDRO_AS-2D 4.0 greift diese Entwicklung auf, sodass numerische Simulationen mit großer Punktanzahl wesentlich kürzere Rechenzeiten benötigen. Dies eröffnet neue Perspektiven für den Einsatz von HYDRO_AS-2D wie die operationelle Berechnung von Hochwasserabflüssen selbst für größere Gebiete und längere Gewässerabschnitte.

Einsetzbare NVIDIA-Karten

Mit Grafikprozessoren (GPU) lässt sich, die Rechenleistung steigern. Der Hersteller NVIDIA bietet verschiedene spezielle Prozessorkarten, die mit mehreren tausenden Prozessoren arbeiten.

HYDRO_AS-2D-GPU wurde für NVIDIA-Tesla-GPU mit minimaler „compute capability“ 2.0 entwickelt. Folgende GPU sind in dieser Produktfamilie gelistet:

  • Tesla K80, K40, K20, K10
  • Tesla C2075, C2050, C2070
  • Tesla M20xx

(Quelle: https://developer.nvidia.com/cuda-gpus, Stand April 2015)

Manche NVIDIA-Quadro oder GeForce-Produkte sind binärkompatibel zur Tesla-Architektur. Dies gilt beispielsweise für die K2200.  Erfahrungen zeigen allerdings, dass HYDRO_AS-2D-GPU auf dieser GPU nicht stabil läuft, sondern in seltenen Fällen Abstürze auftreten.Hydrotec setzt für HYDRO_AS-2D-Projekte die K20-GPU ein (Stand April 2015).

Vergleichbarkeit von Systemen

Für die Rechenleistung ist jedoch nicht allein die Anzahl der Prozessoren, sondern auch ihre Architektur und die Speicherverwaltung ausschlaggebend. Die CPU können aufgrund ihrer Architektur i.d.R. deutlich mehr Rechenleistung pro Prozessor liefern als die GPU. In diesem Zusammenhang ist die angegebene Leistung in TeraFLOP von hoher Bedeutung.
In der Literatur wird oft eine leistungsfähige GPU mit der Leistung eines einzelnen Prozessors, d.h. Single CPU ohne Multithreading, verglichen. Derartige Vergleiche sind allerdings aus folgenden Gründen nicht korrekt: Erstens kostet eine solche GPU zusätzliches Geld und zweitens besteht eine CPU i.d.R. aus mehreren Prozessoren, die Multithreading, Vektorisieren und Parallelisieren unterstützen und somit deutlich mehr Leistung anzubieten haben. Deshalb sollte die Leistung eines einzelnen Prozessors wie z.B. Xeon Phi mit einer leistungsfähigen GPU verglichen werden.