LabelledGreenData4All Hackathon

Thema: „Umsetzung skalierbarer Annotationsstrategien anhand von Fallbeispielen“

Annotierte Daten bilden die Grundlage für eine gute Modellbildung und dienen als treibende Kraft für die Weiterentwicklung KI-gesteuerter Umweltforschung. Jedoch ist die Verfügbarkeit von qualitativ hochwertigen, harmonisierten annotierten Daten stark eingeschränkt.

Ziel des Projektes LabelledGreenData4All („Nachhaltigkeitspotentialanalyse für die Zweckmäßigkeit und den Aufwand von Datenannotationen für Machine Learning-Modelle“) ist es, für das Umweltressort strategische Empfehlungen zu erarbeiten, in welchen Anwendungsbereichen und mit welchen Daten die größten Potentiale für den Einsatz von Machine Learning (ML) Modellen bestehen.

In diesem Hackathon werden wir uns speziell mit den Herausforderungen beschäftigen, mit denen KI-EntwicklerInnen konfrontiert sind, wenn nur wenige gelabelte Daten für das Training von ML-Modellen zur Verfügung stehen.

Melden Sie sich an
The logo of LabelledGreenData4All, consisting of a stylised green leaf with dot-and-line representations of data and connections on the main body. From the leaf's stem hangs a yellow label with the text

Der Hackathon besteht aus drei Teilen

Mit der Registrierung unter dem folgenden Link erhaltet ihr die Einwahldaten für die Einführungsveranstaltung am 30.01.2025.Wir freuen uns auf einen regen Austausch!

LabelledGreenData4All Logo with number 1 on its label instead of the usual text.
Teil 1
In der Auftakt- und Einführungsveranstaltung am Do. 30.01., 9:00-11:00 wird das im Projekt entwickelte Vorgehensmodell zum Umgang mit wenigen annotierten Daten für die Generierung von ML-Anwendungen im Umweltbereich vorgestellt.

Wir diskutieren über die Vor- und Nachteile der verschiedenen Strategien und die zu erwartende Ergebnisqualität der mit diesen Daten trainierten KI-Modelle. Anhand eines Fallbeispiels werden die notwendigen Daten und Technologien für eine praktische Übung vorgestellt.

Im Anschluss an die Veranstaltung erhalten die Teilnehmenden ein Datenpaket und eine Vorgehensstrategie, um ein Fallbeispiel umzusetzen und zu testen.
LabelledGreenData4All Logo with number 2 on its label instead of the usual text.
Teil 2
Im Zeitraum vom 30.01. bis 04.02.2025 haben die Teilnehmenden die Möglichkeit, die vorbereiteten hands-on-exercises eigenständig durchzuführen, oder das Vorgehensmodell mit einem eigenen Anwendungsfall zu testen.

Der vorbereitete Testfall ist so konzipiert, dass das Training der ML-Modelle auch ohne HPC Verfügbarkeit aufgesetzt werden kann.
LabelledGreenData4All Logo with number 3 on its label instead of the usual text.
Teil 3
Am Mi. 05.02., 9:00-11:00 Uhr bieten wir einen weiteren Termin zur Besprechung der Ergebnisse der praktischen Übungen an.

Dieser Termin kann als offene Sprechstunde für Hilfestellungen, Beantwortung von Fragen, Erfahrungsaustausch und gemeinsame Diskussion genutzt werden.

Jetzt Anmelden

Mit der Registrierung erhaltet ihr die Einwahldaten für die Einführungsveranstaltung am 30.01.2025.

Organisiert von

Das Team der wetransform GmbH und des Fraunhofer-Institut für Graphische Datenverarbeitung (IGD) arbeiten gemeinsam daran, die Innovationskraft annotierter Umweltdatensätze sektorübergreifend zu eruieren.

Das auf 12 Monate ausgelegte Forschungsprojekt „Nachhaltigkeitspotentialanalyse für die Zweckmäßigkeit und den Aufwand von Datenannotationen für Machine Learning-Modelle“ aus dem Ressortforschungsplan des Bundesministeriums für Umwelt, Naturschutz, nukleare Sicherheit und Verbraucherschutz wird im Auftrag des Umweltbundesamtes durchgeführt. Forschungskennzeichen: FKZ 3723 11 602 0.

Kontakt

Franziska Hochenegger
wetransform GmbH
fh@wetransform.to

Dr. Eva Klien
Fraunhofer IGD
eva.klien@igd.fraunhofer.de

logo of the German Environmental Agency, the Umweltbundesamt
Umweltbundesamt Deutschland
logo of Fraunhofer IGD
Fraunhofer-IGD
wetransform logo
wetransform GmbH