Im Mittelpunkt dieses Moduls steht die Frage nach Node-Level Performance-Optimierung, wobei der Schwerpunkt auf den Zusammenhängen zwischen der Prozessormikroarchitektur und der darauf erzielten Performance liegt. Dadurch wird ein wichtiges Teilgebiet des High Performance Computings betrachtet, das in den letzten Jahren immer größere Bedeutung gewonnen hat. Aufbauend auf einer Beschreibung der Grundprinzipien des Aufbaus der modernen Prozessoren wird ein Überblick über die wichtigsten Optimierungstechniken für eine effiziente Implementierung der numerischen und darüber hinaus der daten- und rechenintensiven Algorithmen gegeben. Anschließend wird Vektorisierung als besondere Technik der Parallelisierung erklärt und der Zusammenhang mit Pipelining erläutert. Hardware wird am Beispiel Intel AVX und NEC Aurora erläutert. Beispiele von vektorisierbaren und nicht vektorisierbaren Schleifen werden gegeben, die Unterstützung durch Compiler angesprochen und auf Eigenschaften der „OpenMP SIMD“ Konstrukte hingewiesen. Empfehlungen zur Programmierung leistungsfähiger Kerne werden gegeben.
Weitere Informationen zum Modul finden Sie hier.
kontakt(at)supercomputing-akademie.de
Online course Organizer: HLRS, University of Stuttgart, Germany
13. Sep 2021
25. Okt 2021
Online
Deutsch
Performance-Optimierung & Debugging
Supercomputing-Akademie
Code-Optimierung
OpenMP
Zurück zur Liste
Dezember 02 - 05, 2024
Online by JSC
Dezember 09 - 13, 2024
Januar 13 - 31, 2025
Hybrid Event - Stuttgart, Germany
Januar 21 - 23, 2025
Februar 17 - 21, 2025
Stuttgart, Germany
März 17 - 21, 2025
Dresden, Germany