Themen der Künstlichen Intelligenz (KI) waren lange Zeit nur ein leeres Schlagwort. Heutzutage hat KI bereits die Entwicklungslabore verlassen und hat Einzug in den Alltag erhalten. Algorithmen und Systeme der Künstlichen Intelligenz sind allgegenwärtig. Sei es die Empfehlung von Produkten bei Amazon, über Serienempfehlungen in Netflix oder die Interaktion mit Sprachassistenten wie Alexa oder Cortana. Dieses Modul soll einen ersten Einblick in die „Blackbox Datenanalyse“ geben. Hierzu gehört nicht nur die Definition relevanter Kernbegriffe, sondern auch deren Abgrenzung. Sie bekommen in diesem Modul einen ersten Einblick in den typischen Ablauf einer Datenanalyse („Workflow“) anhand konkreter Beispiele. Die Beispiele werden vervollständigt durch eine Reihe von Praxisbeispielen. Dieser Kurs bietet darüber hinaus die Möglichkeit zum intensiven Austausch mit den Dozenten sowie den anderen Kursteilnehmern.
Flexible online course: Combination of self-study and live seminars (HLRS Supercomputing Academy) Organizer: HLRS, University of Stuttgart, Germany
Nov 04, 2024
Dec 13, 2024
Online (flexible)
German
Basic
Data in HPC / Deep Learning / Machine Learning
Supercomputing Academy
Machine Learning
Back to list
Themenbereiche
Übungen auf dem Trainingscluster der Supercomputing Akademie
Die Übungen werden auf dem Trainingscluster des HLRS der Supercomputing Akadmie durchgeführt. Teilnehmer:innen erhalten dafür einen 24/7-Zugang zum Cluster über die gesamte Dauer des Kurses. Die Übung zu Container-Technologien wird udocker (Basistool für User zur Ausführung von Docker Containern) vorgstellt und verwendet. 50% der Übungen werden mit einem Jupyter Notebook auf dem Trainingscluster durchgeführt. Die Übung zur explorativen Datenanalyse sowie die Übung zu Neuronalen Netzen werden zudem über einen Container bearbeitet, sodass die Teilnehmer:innen sich Ihren Containern exportieren, die Übungen komfortabel mitnehmen und auf einem anderen Hostsystem (welches eine Software zur Container-Visualisierung installiert hat) problemlos ausführen können. Für die Übung zur Datenanalyse am Beispiel Stuttgarter S-Bahn Fahrzeiten wird Apache Spark (ein Framework für Cluster Computing) verwendet.
52,50€ Student:innen ohne Masterabschluss (oder äquivalentem Abschluss)
127,50€ Mitarbeiter:in oder Doktorand:in an einer deutschen Universität oder einem deutschen öffentlichen Forschungsinstitut
255,00€ Mitarbeiter:in oder Doktorand:in an einer Universität oder einem öffentlichen Forschungsinstitut in einem anderen EU-, EU-assoziierten oder PRACE-Land als Deutschland
510,00€ Mitarbeiter:in oder Doktorand:in an einer Universität oder einem öffentlichen Forschungsinstitut außerhalb eines EU-, EU-assoziierten oder PRACE-Landes
1410,00€ Andere Teilnehmer:innen, z. B. aus der Industrie, von anderen öffentlichen Einrichtungen oder private Teilnahme
Link zu den EU und EU-assoziierten (Horizon Europe), und PRACE Ländern.
Da die vorgesehenen Übungen auf dem HLRS-Trainingscluster bereitgestellt werden, benötigen die Kursteilnehmer erweiterte Grundkenntnisse des freien Betriebssystems Linux. Die wichtigsten Konzepte und Werkzeuge von Linux wie
Shell und Shell-Befehle (→ sicherer Umgang mit der Kommandozeile),
Secure Shell (SSH-Verbindung zum Cluster herstellen),
den Umgang mit Dateien und Skripten (kopieren, verschieben, umbenennen),
die Struktur des Systems (Verzeichnisse wechseln),
die Benutzer- und Rechteverwaltung (wem eine Datei gehört und wer diese lesen, ändern und ausführen darf) und
das Erstellen/Modifizieren von einfachen (ggf. vorhandenen) Batch-Skripten mit einem Editor wie nano, vi oder emacs
sollten bekannt sein. Eine Anleitung zur Arbeit auf dem Trainingscluster wird zur Verfügung gestellt. Falls Sie bei sich in dieser Hinsicht noch Defizite feststellen, verweisen wir an dieser Stelle auf https://www.tuxcademy.org/product/lxes/.
Vorkenntnisse in Python sind erforderlich. Von den Teilnehmer:innen wird vorausgesetzt,dass Sie zur Verfügung gestellten Beispielcodes lesen und modifizieren zu können. Alternativ verfügen die Teilnehmer über solide Programmierkenntnisse in einer anderen Programmiersprache (z.B. C/C++, Fortran oder Java) und sind dadurch in der Lage sich leicht in die Programmiersprache Python einzuarbeiten. Da Python verwendet wird, kann dieses Tutorial zum Erlernen der Syntax verwendet werden. Für die Übungen werden die Programmbibliotheken
für die Programmiersprache Python verwendet. Es wird empfohlen sich bereits vorab mit diesen Bibliotheken und deren Methoden vertraut zu machen. Erste Erfahrungen im Umgang mit Jupyter Notebooks sind ebenfalls erforderlich. Da Jupyter Notebooks verwendet werden, kann dieses Tutorial genutzt werden, um sich damit vertraut zu machen.
Um sich Datensätze anzuschauen, wird der Umgang mit einem Tabellenkalkulationsprogramm (z.B. Microsoft Excel, LibreOffice Calc) vorausgesetzt.
Rechner mit ssh-Zugang zum Trainingscluster (mit ssh-Key).
Ggf. muss Software installiert werden. Dafür notwendige Rechte müssen vorhanden sein.
Netzverbindungen nach außen zu fremden Clustern müssen aufgebaut werden können.
Software: Mozilla Firefox/ Google Chrome Browser
Eine stabile Internetverbindung für das Bearbeiten der Lerninhalte und Übungen wird empfohlen.
Zugang zu Videokonferenz-Tool mit Kamera und Mikrofon (ein Headset wird aus Qualitätsgründen empfohlen).
Der Zeitaufwand pro Modul beträgt insgesamt 50 Stunden bei wochenweise freier Zeiteinteilung sowie feste Termine für virtuelle Seminare (abends) und Prüfung (tagsüber). Die Dauer erstreckt sich über 5 Wochen mit einem ungefähren wöchentlichen Aufwand von 10 Stunden.
Sie lernen in komfortabler und effektiver Onlinelehre und erwerben so HPC-Fähigkeiten auf höchstem Niveau. Ergänzt werden die Online-Phasen durch regelmäßige Online-Meetings im virtuellen Klassenraum. Bei freier Zeiteinteilung wenden die Teilnehmerinnen und Teilnehmer das Gelernte in Übungen auf dem Trainingscluster an. Die Fachexperten des HLRS, welche die Lerneinheiten entwickelt haben, stehen in wöchentlichen virtuellen Seminaren für Fragen zur Verfügung. Ein Forum ermöglicht den fachlichen Austausch der Teilnehmerinnen und Teilnehmer untereinander.
Für die Teilnahme an dem Modul erhalten Sie vom Höchstleistungsrechenzentrum Stuttgart eine Teilnahmebestätigung. Wenn Sie zudem sämtlich Lerninhalte des Moduls bearbeitet, regelmäßig an den virtuellen Seminaren teilgenommen und die Lernaufgaben fachgerecht beantwortet haben, erhalten Sie eine qualifizierte Teilnahmebestätigung.
Sie erhalten ein Zertifikat, wenn Sie die Voraussetzungen für die qualifizierte Teilnahmebestätigung erfüllen und die Abschlussprüfung des Moduls bestehen. Mit der erfolgreichen Prüfung weisen Sie nach, dass Sie Kompetenzen erworben haben, das erlernte Wissen selbständig anzuwenden.
Tibor Doepper, phone 0711 685 87233, training(at)hlrs.de
Für weitere Informationen zur Supercomputing Akademie besuchen Sie unsere Website: https://www.supercomputing-akademie.de/
Weitere Kursangebote finden Sie auf Training Overview und Supercomputing Akademy Overview.
March 10 - 12, 2025
Online