Im Mittelpunkt dieses Moduls steht die Frage nach Node-Level Performance-Optimierung, wobei der Schwerpunkt auf den Zusammenhängen zwischen der Prozessormikroarchitektur und der darauf erzielten Performance liegt. Dadurch wird ein wichtiges Teilgebiet des High Performance Computings betrachtet, das in den letzten Jahren immer größere Bedeutung gewonnen hat. Aufbauend auf einer Beschreibung der Grundprinzipien des Aufbaus der modernen Prozessoren wird ein Überblick über die wichtigsten Optimierungstechniken für eine effiziente Implementierung der numerischen und darüber hinaus der daten- und rechenintensiven Algorithmen gegeben. Anschließend wird Vektorisierung als besondere Technik der Parallelisierung erklärt und der Zusammenhang mit Pipelining erläutert. Hardware wird am Beispiel Intel AVX und NEC Aurora erläutert. Beispiele von vektorisierbaren und nicht vektorisierbaren Schleifen werden gegeben, die Unterstützung durch Compiler angesprochen und auf Eigenschaften der „OpenMP SIMD“ Konstrukte hingewiesen. Empfehlungen zur Programmierung leistungsfähiger Kerne werden gegeben.
Weitere Informationen zum Modul finden Sie hier.
kontakt(at)supercomputing-akademie.de
Online course Organizer: HLRS, University of Stuttgart, Germany
Sep 13, 2021
Oct 25, 2021
Online
German
Performance Optimization & Debugging
Supercomputing Academy
Code Optimization
OpenMP
Back to list
December 02 - 05, 2024
Online by JSC
December 09 - 13, 2024
January 13 - 31, 2025
Hybrid Event - Stuttgart, Germany
January 21 - 23, 2025
February 17 - 21, 2025
Stuttgart, Germany
March 17 - 21, 2025
Dresden, Germany