OpenHyPE: OpenHygrisC-Datenverarbeitung fĂŒr die Lehre
- NRW-Förderprojekt
- Gefördert durch das Ministerium fĂŒr Landwirtschaft und Verbraucherschutz NRW (MLV)
- Laufzeit: 15.12.2021 - 30.06.2023
0. Zusammenfassung
Das Landesamt fĂŒr Natur, Umwelt und Verbraucherschutz (LANUV) des Landes Nordrhein-Westfalen (NRW) stellt umfangreiche quantitative und qualitative Grundwassermessdaten zur VerfĂŒgung. Damit wird ein Beitrag zur ErfĂŒllung der EuropĂ€ischen Wasserrahmenrichtlinie sowie der EU INSPIRE-Richtlinie fĂŒr eine offene interoperable Geodateninfrastruktur geleistet.
NRW betreibt ein eigenes wasserbezogenes Datenportal ELWAS-WEB, das auch die Grundwasserdatenbank HygrisC bereitstellt. ELWAS und HygrisC sind nicht einfach zu bedienen und bieten der Ăffentlichkeit nur begrenzte Möglichkeiten zur explorativen Datenanalyse.
NRW veröffentlicht jedoch einen GroĂteil seiner Grundwasserdaten als offenes Datenarchiv namens OpenHygrisC, das mehrere Datentabellen im csv-Format enthĂ€lt. Insbesondere die Messdatentabelle ist âBig Dataâ, denn sie enthĂ€lt alle Zeitreihen mit mehr als 3,6 Millionen Einzelmessungen (Tabellenzeilen). Diese groĂe Tabelle sowie die Tabelle mit den rĂ€umlichen Koordinaten der Grundwassermessstellen erfordern den Einsatz eines rĂ€umlichen objektrelationalen Datenbankmanagementsystems (Spatial ODBRMS) und ein umfangreiches Data Engineering vor dem EinfĂŒgen in die Datenbank.
Das Ziel des OpenHyPE-Projekts ist es, eine erste Reihe von Open Educational Resources (OER) (freie Lehrmaterialien) zu entwickeln, um den Aufbau, die BefĂŒllung und die Nutzung einer rĂ€umlich-zeitlichen Datenbank mit den OpenHygrisC-Daten zu trainieren. Aufgrund des abgestuften Schwierigkeitsgrades richtet sich das Projekt an SchĂŒlerinnen und SchĂŒler von weiterfĂŒhrenden Schulen sowie Hochschulen im Land Nordrhein-Westfalen und darĂŒber hinaus.
Alle verwendeten Softwareprodukte sind Free and Open Source Software (FOSS). Die Datenbank, die wir OpenHyPE DB nennen, basiert auf PostgreSQL / PostGIS und bildet das Zentrum des Systems zur Analyse und PrÀsentation von Umweltdaten. Die Lehrmaterialien demonstrieren, wie das geographische Informationssystem QGIS sowie Python-Programme in der JupyterLab-Entwicklungsumgebung mit der OpenHyPE DB zusammenarbeiten, um die Daten in Form von zeitabhÀngigen Karten oder Zeitreihen auszuwÀhlen, zu analysieren und darzustellen. Wir verwenden Python und Jupyter aus der Anaconda Distribution.
Die Anschubfinanzierung fĂŒr das OpenHyPE-Projekt dient dazu, die wertvolle öffentliche Umweltdatensammlung des Landes NRW bei jungen Menschen bekannt zu machen sowie einen Beitrag zur interdisziplinĂ€ren MINT-Förderung im Allgemeinen und zur Bildung fĂŒr nachhaltige Entwicklung (BNE) im Besonderen durch die VerknĂŒpfung von Umweltwissenschaften und Informatik zu leisten.
1. Einleitung
1.1 Problembeschreibung
Das Land Nordrhein-Westfalen (NRW) betreibt ĂŒber das LANUV umfassende und professionelle Messnetze zur Erfassung von Umweltdaten. Im Rahmen von Open.NRW und angetrieben durch die INSPIRE-Direktive der EuropĂ€ischen Union sowie weitere Direktiven wie zum Beispiel die EU-Wasserrahmenrichtlinie (WRRL) werden vom Land NRW umfangreiche Daten-Produkte offen zugĂ€nglich und frei nutzbar auf verschiedenen Plattformen zur VerfĂŒgung gestellt (Free and Open Data).
Das Land NRW ist in Deutschland ein Vorreiter bei der Bereitstellung von offenen und (kosten)freien Geodaten. Diese Daten sind ein wahrer Schatz und bilden die Grundlage fĂŒr potentiell massiven Erkenntnisgewinn im Bereich Umwelt- und Naturschutz. Trotzdem scheint es so zu sein, dass nur ein vergleichsweise kleiner Personenkreis dieses Potential wirklich nutzt. Deshalb hat sich das Projekt OpenHyPE zur Aufgabe gemacht, diesen Datenbestand in die Hochschullehre einzubauen und entsprechendes frei zugĂ€ngliches Lehrmaterial zu entwickeln, dass nicht nur von Studierenden sondern auch zum Teil von SchĂŒlerinnen und SchĂŒlern genutzt werden kann, um die GrundzĂŒge der Umweltdatenverarbeitung zu lernen. Die Anschubfinanzierung soll genutzt werden, um erste Schritte der Entwicklung solchen Training-Materials umzusetzen.
Wir verfolgen dabei das Paradigma des âProblem based learningâ: Die notwendigen Kenntnisse und FĂ€higkeiten werden anhand einer konkreten gesellschaftlich relevanten Problemstellung identifiziert und vermittelt. Die Lösung der als bedeutsam erkannten Fragestellung ist die Motivation fĂŒr das Lernen.
Am Anfang wollen wir das Material anhand des Problemfelds âGrundwasserschutzâ entwickeln. Das Ministerium fĂŒr Umwelt, Landwirtschaft, Natur- und Verbraucherschutz NRW (MULNV) betreibt ĂŒber den âLandesbetrieb Information und Technik Nordrhein-Westfalenâ (IT.NRW) ein eigenes wasserbezogenes Datenportal namens ELWAS-WEB. Darin werden auch Daten der landesweiten Grundwasserdatenbank HygrisC vorgehalten. ELWAS und HygrisC bieten AuĂenstehenden nur eingeschrĂ€nkte Möglichkeiten der explorativen Datenanalyse. Aus Sicht des Usability Engineering, das sich mit der Anwenderfreundlichkeit technischer Systeme befasst, sind hinsichtlich der Benutzbarkeit sowie der Datenanalyse-Möglichkeiten Verbesserungen wĂŒnschenswert, denn gerade die explorative Datenanalyse und das Data Mining helfen, Strukturen und ZusammenhĂ€nge zwischen den Daten zu erkennen. ELWAS und HygrisC sind deshalb nur bedingt geeignet, Grundlagen der Umweltdatenanalyse zu vermitteln, können aber im Unterricht als Begleitmaterial einflieĂen.
Auf dem Portal OpenGeodata.NRW werden umfangreiche Daten mit Raumbezug â auch Geodaten genannt â zur VerfĂŒgung gestellt, die oft einen Zeitbezug haben, wie z.B. LandnutzungsĂ€nderungen oder Messdatenreihen zur WasserqualitĂ€t. Dort liegen auch AuszĂŒge der HygrisC-Grundwasser-Datenbank des Landes NRW, die unter dem Namen OpenHygrisC veröffentlicht werden. Diese Grundwasserdaten können in idealer Weise als Grundlage zum Aufbau einer eigenen Umweltdatenbank dienen, anhand derer die Lernenden Konzepte des Datenmanagements und der Datenanalyse kennenlernen.
1.2 Projektziele
Folgende Komponenten sollen realisiert werden:
- Entwicklung der OpenHyPE Geodatenbank auf Basis von PostgreSQL/PostGIS zur Verwaltung raum- und zeitbezogener Daten zu GrundwasserqualitÀt und -menge
- Problembezogenes freies Online-Kursmaterial (OER), Tutorials, Video-Tutorials, Anleitungen, Programm-Code, unter Verwendung von Free and Open Source Software (FOSS):
- Vorstellung des Landesamts fĂŒr Natur, Umwelt- und Verbraucherschutz (LANUV)
- EinfĂŒhrung in den Grundwasserschutz
- EinfĂŒhrung in das Geographische Informationssystem QGIS
- EinfĂŒhrung in die relationale Datenbank PostgreSQL und die Abfragesprache SQL
- EinfĂŒhrung in die Geodatenbank-Erweiterung PostGIS
- EinfĂŒhrung in die Verarbeitung von Geodaten mit der Programmiersprache Python
- Installation des OpenHyPE Datenbank-Managementsystems
- Diskussion des Datenmodells und Hochladen der OpenHygrisC-Daten des LANUV
- Automatisches Erstellen von Diagrammen zu Zeitreihen der WasserqualitÀt
- Automatisches Erstellen von Karten zur Grundwasserchemie
- Erstellen einfacher Dashboards mit interaktiven Online-Grafiken und -Karten
- EinfĂŒhrung in Data Mining (Deskriptive Statistik, Suchen nach ZusammenhĂ€ngen)