Im Mittelpunkt dieses Moduls steht die Frage nach Node-Level Performance-Optimierung, wobei der Schwerpunkt auf den Zusammenhängen zwischen der Prozessormikroarchitektur und der darauf erzielten Performance liegt. Dadurch wird ein wichtiges Teilgebiet des High Performance Computings betrachtet, das in den letzten Jahren immer größere Bedeutung gewonnen hat. Aufbauend auf einer Beschreibung der Grundprinzipien des Aufbaus der modernen Prozessoren wird ein Überblick über die wichtigsten Optimierungstechniken für eine effiziente Implementierung der numerischen und darüber hinaus der daten- und rechenintensiven Algorithmen gegeben. Anschließend wird Vektorisierung als besondere Technik der Parallelisierung erklärt und der Zusammenhang mit Pipelining erläutert. Hardware wird am Beispiel Intel AVX und NEC Aurora erläutert. Beispiele von vektorisierbaren und nicht vektorisierbaren Schleifen werden gegeben, die Unterstützung durch Compiler angesprochen und auf Eigenschaften der „OpenMP SIMD“ Konstrukte hingewiesen. Empfehlungen zur Programmierung leistungsfähiger Kerne werden gegeben.
Weitere Informationen zum Modul finden Sie hier.
kontakt(at)supercomputing-akademie.de
Online course Organizer: HLRS, University of Stuttgart, Germany
19. Sept. 2022
24. Okt. 2022
Online
Deutsch
Performance-Optimierung & Debugging
Supercomputing-Akademie
Code-Optimierung
OpenMP
Zurück zur Liste
April 08 - 09, 2025
Mai 05 - 08, 2025
Mai 09 - 23, 2025
Hybrid Event - Stuttgart, Germany
Juni 16 - 17, 2025
Juni 17 - 18, 2025
Juli 09 - 10, 2025
August 20 - 29, 2025
Online by ETH
Oktober 13 - 17, 2025
Stuttgart, Germany