Höchstleistungsrechenzentrum Stuttgart: Performance Optimierung

Im Mittelpunkt dieses Moduls steht die Frage nach Node-Level Performance-Optimierung, wobei der Schwerpunkt auf den Zusammenhängen zwischen der Prozessormikroarchitektur und der darauf erzielten Performance liegt. Dadurch wird ein wichtiges Teilgebiet des High Performance Computings betrachtet, das in den letzten Jahren immer größere Bedeutung gewonnen hat. Aufbauend auf einer Beschreibung der Grundprinzipien des Aufbaus der modernen Prozessoren wird ein Überblick über die wichtigsten Optimierungstechniken für eine effiziente Implementierung der numerischen und darüber hinaus der daten- und rechenintensiven Algorithmen gegeben. Anschließend wird Vektorisierung als besondere Technik der Parallelisierung erklärt und der Zusammenhang mit Pipelining erläutert. Hardware wird am Beispiel Intel AVX und NEC Aurora erläutert. Beispiele von vektorisierbaren und nicht vektorisierbaren Schleifen werden gegeben, die Unterstützung durch Compiler angesprochen und auf Eigenschaften der „OpenMP SIMD“ Konstrukte hingewiesen. Empfehlungen zur Programmierung leistungsfähiger Kerne werden gegeben.

Weitere Informationen zum Modul finden Sie hier.