zum Inhalt springen

Ein Kurspaket für alle, die schon immer mal programmieren lernen wollten, aber nicht wissen, wo sie anfangen sollen. Für Leute mit Angst vor Fehlermeldungen und dem schwarzen Fenster. Für alle, die schon mal das Chaos auf ihrem Rechner verflucht haben. Kommt vorbei!

Bei Dinge mit Daten beschäftigen wir uns in jeder Sitzung mit einem neuen Thema, Vorkenntnisse werden nicht vorausgesetzt, außer wenn explizit angegeben. Ihr könnt zu allen Sitzungen kommen oder nur zu ausgewählten. Da wir nach einer kurzen Einführung immer auch einen Hands-on-Teil geplant haben, braucht Ihr einen Laptop zum Mitmachen und solltet die angegebenen Programme vor der Sitzung installiert haben.

Weitere Informationen, Installationslinks und Materialien zu den Sitzungen findet Ihr auf Ilias-Edulabs.

 Termine und Themen im WS 2024/25:

15.10. Einführung in R
Alle um Dich herum machen Statistik, Visualisierung oder andere wichtige Dinge in R? Du hast schon mal versucht, anzufangen, aber das scheint ein Buch mit sieben Siegeln zu sein? In dieser Session machen wir gemeinsam erste Schritte in R, machen uns mit einfachen Befehlen vertraut und lernen RStudio kennen.

22.10. Einführung in Python
Python ist eine beliebte Skriptsprache, die in Wissenschaft und Industrie für vielfältige Aufgaben produktiv eingesetzt wird. Als Skriptsprache ist sie auf allen gängigen Betriebssystemen einsetzbar und ermöglicht es, sich interaktiv vom der Idee oder einem Problem zum fertigen Skript vorzuarbeiten. In diesem Kurs wollen wir einen ersten Schritt in die Welt von Python unternehmen.

29.10. Einführung in Bash
Die Bash ist ein mächtiger Kommandozeileninterpreter, der für alle gängigen Betriebssysteme zur Verfügung steht. In diesem Kurs wollen wir einen ersten Einstieg wagen und uns auf einen Linux-Server der Uni einloggen. Dort wollen wir uns mit grundlegenden Befehlen auseinandersetzen und sehen, wie wir mit der Bash effizient mit Daten umgehen können.

5.11. Dateinamen und Ordnerstrukturen
Sind Deine Dateinamen witzig, aber nutzlos? Bist Du auf Deinem Rechner immer wieder auf der Suche nach Dateien? Hast Du schon mal wichtige Dinge gelöscht oder überschrieben, weil Du den Überblick verloren hattest? In dieser Sitzung geht es um Prinzipien der Dateibenennung und Ordnerstruktur, die sowohl für Deine eigenen Dateien, als auch für das Management von Forschungsdaten in größeren Projekten sinnvoll sind.

12.11. Dateien und Formate
Wir haben alle täglich mit Dateien um und die meisten Programme geben uns vielfältige Möglichkeiten unsere Arbeit in verschiedenen Formaten und Kodierungen zu speichern. Wie aber funktionieren Dateien eigentlich und warum sprechen wir von Binärdateien, wenn doch alles in Nullen und Einsen gespeichert wird? Für einen ersten Eindruck wollen wir uns in dieser Einführung verschiedene Dateien einmal genauer ansehen.

19.11. Daten finden
Hast Du Dich schon mal auf die Suche gemacht, um mit Daten eine Frage zu beantworten und nicht so richtig zum Ziel gefunden? Im Kurs stellen wir einige Repositorien und Such-Möglichkeiten vor, schauen uns die verschiedenen Formate an, in denen die Daten vorliegen können und überlegen, was man bei der Nachnutzung von Daten beachten muss.  

26.11. OpenRefine
Größere Datenmengen sind irgendwann mit Excel nicht mehr gut zu handhaben, andererseits braucht es schon ein bisschen Routine in R oder Python, um sich einen ersten Überblick über die Daten zu verschaffen, bzw. sie ein bisschen aufzuräumen. OpenRefine ist hier ein willkommener Mittelweg, große Tabellen lassen sich damit einfach überblicken, aufräumen und die Arbeitsschritte dann auch dokumentieren. 

3.12. Reguläre Ausdrücke
Du hast einen riesigen Haufen Dateien, bei denen Du die Benennung ändern willst? Du willst auf Deinem Rechner komplexe Suchen formulieren können? Du hast Dich schon immer gefragt, wie das mit dem Validieren einer Email-Adresse funktioniert? Reguläre Ausdrücke sind ein nützliches Tool, das einem beim Datenmanagment, beim Data-Wrangling oder an vielen anderen Stellen begegnet. Die Sitzung umfasst eine Einführung in das Konzept und kurze praktische Übungen.

10.12.Visualisierung mit ggplot2
Zur Exploration der Daten und Kommunikation der Ergebnisse sind professionelle Grafiken unabdingbar. Du hast schon etwas Vorerfahrung in R, würdest aber gerne mehr über Visualisierung wissen? Nach einer kurzen Einführung in die Visualisierung lernen wir in dieser Sitzung das Standardpaket in R ggplot2 kennen und probieren verschiedene Plot-Typen aus.

17.12. Reproduzierbare Paper mit R & Quarto
Nie mehr Copy-Pasten von Analyseergebnissen, Daten oder Plots aus R nach Word? Alles komplett in einem Dokument, das dazu noch gut aussieht und Deine Analysen transparent und nachvollziehbar macht? Mit Quarto und R kannst Du Dokumente in Markdown erstellen.

7.1. API-Abfrage mit R
Große Datensätze und kontinuierliche Datensammlungen werden gerne über ein Application Programming Interface (API) über das Internet bereitgestellt. In diesem Kurs wollen wir uns ansehen, wie wir mit dem R-Paket httr auf APIs zugreifen können und die Daten anschließend in R weiterverarbeiten können.

14.1. Einführung in Git
Git ist ein dezentrales Versionsmanagementsystem, das aus der Softwareentwicklung kommt.
Im Zuge von Open Science wird Git zunehmend zur Versionierung von Datenworkflows, Projektdokumentation, sowie der Erstellung von Publikationen und Präsentationen verwendet.
In dieser Einführung wollen wir erste Erfahrungen mit Git machen und uns mit den grundlegenden Funktionen vertraut machen.