skip to content

A course package for anyone who has always wanted to learn how to program but didn't know where to start. For people who are afraid of error messages and the black window. For anyone who has ever cursed the chaos on their computer. Come and join us!

In the Daten sessions, we cover a new topic in each session; no prior knowledge is assumed unless explicitly stated. You can come to all sessions or just to selected ones. Since we always plan a hands-on part after a short introduction, you need a laptop to participate and should have the specified programs installed before the session.
 

Further information, installation links, and materials for the sessions can be found on Ilias-Edulabs.

Dates and topics in the winter semester 2024/25:

15.10. Einführung in R
Alle um Dich herum machen Statistik, Visualisierung oder andere wichtige Dinge in R? Du hast schon mal versucht, anzufangen, aber das scheint ein Buch mit sieben Siegeln zu sein? In dieser Session machen wir gemeinsam erste Schritte in R, machen uns mit einfachen Befehlen vertraut und lernen RStudio kennen.

22.10. Einführung in Python
Python ist eine beliebte Skriptsprache, die in Wissenschaft und Industrie für vielfältige Aufgaben produktiv eingesetzt wird. Als Skriptsprache ist sie auf allen gängigen Betriebssystemen einsetzbar und ermöglicht es, sich interaktiv vom der Idee oder einem Problem zum fertigen Skript vorzuarbeiten. In diesem Kurs wollen wir einen ersten Schritt in die Welt von Python unternehmen.

29.10. Einführung in Bash
Die Bash ist ein mächtiger Kommandozeileninterpreter, der für alle gängigen Betriebssysteme zur Verfügung steht. In diesem Kurs wollen wir einen ersten Einstieg wagen und uns auf einen Linux-Server der Uni einloggen. Dort wollen wir uns mit grundlegenden Befehlen auseinandersetzen und sehen, wie wir mit der Bash effizient mit Daten umgehen können.

5.11. Dateinamen und Ordnerstrukturen
Sind Deine Dateinamen witzig, aber nutzlos? Bist Du auf Deinem Rechner immer wieder auf der Suche nach Dateien? Hast Du schon mal wichtige Dinge gelöscht oder überschrieben, weil Du den Überblick verloren hattest? In dieser Sitzung geht es um Prinzipien der Dateibenennung und Ordnerstruktur, die sowohl für Deine eigenen Dateien, als auch für das Management von Forschungsdaten in größeren Projekten sinnvoll sind.

12.11. Dateien und Formate
Wir haben alle täglich mit Dateien um und die meisten Programme geben uns vielfältige Möglichkeiten unsere Arbeit in verschiedenen Formaten und Kodierungen zu speichern. Wie aber funktionieren Dateien eigentlich und warum sprechen wir von Binärdateien, wenn doch alles in Nullen und Einsen gespeichert wird? Für einen ersten Eindruck wollen wir uns in dieser Einführung verschiedene Dateien einmal genauer ansehen.

19.11. Daten finden
Informationen hierzu folgen in Kürze.

26.11. OpenRefine
Größere Datenmengen sind irgendwann mit Excel nicht mehr gut zu handhaben, andererseits braucht es schon ein bisschen Routine in R oder Python, um sich einen ersten Überblick über die Daten zu verschaffen, bzw. sie ein bisschen aufzuräumen. OpenRefine ist hier ein willkommener Mittelweg, große Tabellen lassen sich damit einfach überblicken, aufräumen und die Arbeitsschritte dann auch dokumentieren. 

3.12. Reguläre Ausdrücke
Du hast einen riesigen Haufen Dateien, bei denen Du die Benennung ändern willst? Du willst auf Deinem Rechner komplexe Suchen formulieren können? Du hast Dich schon immer gefragt, wie das mit dem Validieren einer Email-Adresse funktioniert? Reguläre Ausdrücke sind ein nützliches Tool, das einem beim Datenmanagment, beim Data-Wrangling oder an vielen anderen Stellen begegnet. Die Sitzung umfasst eine Einführung in das Konzept und kurze praktische Übungen.

10.12.Visualisierung mit ggplot2
Zur Exploration der Daten und Kommunikation der Ergebnisse sind professionelle Grafiken unabdingbar. Du hast schon etwas Vorerfahrung in R, würdest aber gerne mehr über Visualisierung wissen? Nach einer kurzen Einführung in die Visualisierung lernen wir in dieser Sitzung das Standardpaket in R ggplot2 kennen und probieren verschiedene Plot-Typen aus.

17.12. Reproduzierbare Paper mit R & Quarto
Nie mehr Copy-Pasten von Analyseergebnissen, Daten oder Plots aus R nach Word? Alles komplett in einem Dokument, das dazu noch gut aussieht und Deine Analysen transparent und nachvollziehbar macht? Mit Quarto und R kannst Du Dokumente in Markdown erstellen

7.1. API-Abfrage mit R
Große Datensätze und kontinuierliche Datensammlungen werden gerne über ein Application Programming Interface (API) über das Internet bereitgestellt. In diesem Kurs wollen wir uns ansehen, wie wir mit dem R-Paket httr auf APIs zugreifen können und die Daten anschließend in R weiterverarbeiten können.

14.1. Einführung in Git
Git ist ein dezentrales Versionsmanagementsystem, das aus der Softwareentwicklung kommt.
Im Zuge von Open Science wird Git zunehmend zur Versionierung von Datenworkflows, Projektdokumentation, sowie der Erstellung von Publikationen und Präsentationen verwendet.
In dieser Einführung wollen wir erste Erfahrungen mit Git machen und uns mit den grundlegenden Funktionen vertraut machen.