Datenmanagement im Datenkreis "Interdisziplinäres Forschungsprojekt"
Solution
Datenmanagement im Datenkreis "Interdisziplinäres Forschungsprojekt"
Mit der gesteigerten Bedeutung von digitalen Daten in der Wissenschaft bilden sich auch neue Formen der wissenschaftlichen Zusammenarbeit. Software-, Hardware-, und Cloudengineers arbeiten eng mit Data Scientists, Statistikern und Domänenexperten zusammen um neuartige, datenintensive Forschung zu betreiben. Der Datenkreis „Interdisziplinäres Forschungsprojekt“ kennzeichnet sich vor allem durch seine Schnelllebigkeit. Neue Erkenntnisse aus der Datenanalyse fließen laufend in den Datengewinnungsprozess zurück und passen ihn an. Vor allem in der frühen Projektphase führt dies dazu, dass sich Datenmodelle, Verarbeitungsprozesse und Schnittstellen laufend ändern. Bestehende Datenmanagementplattformen können diese Schnelllebigkeit kaum abbilden. Entweder sind sie zu domänenspezifisch – es werden bekannte Datenmodelle vorausgesetzt und diese sind schwer anpassbar – oder zu generell und dienen primär als Ablageort für Dateien, ohne dabei den Kontext (= Metadaten) zu erhalten.
Mit der Human Motion Data Platform (HMDP) geht Salzburg Research einen Mittelweg. Sie ermöglicht es, Forschungsdaten aus unterschiedlichen Datenquellen schnell zu planen, einfach in das Projekt zu integrieren, nachvollziehbar zu analysieren, und nachhaltig zu archivieren. Erreicht wird dies, indem Datenqualität über den gesamten Forschungsdatenlebenszyklus gemanagt wird. Im Fokus steht das Data Wrangling. Dabei werden gerade gewonnene Daten von den verschiedenen Messinstrumenten (z.B. IoT Sensoren, Laborgeräte, Fragebögen, etc.) heruntergeladen, dokumentiert und organisiert, bevor sie mit dem Projektkonsortium geteilt werden können. Fehler in dieser Phase führen zu irreparablem Verlust der Datenqualität, was sich negativ auf den darauffolgenden Datenanalyseprozess auswirkt.
Ein projektweiter Datenkatalog macht alle Datenobjekte und deren Metadaten auffindbar. Katalogeinträge sind verknüpft mit Studienprotokollen und den Metadaten der benutzten Messinstrumente. Damit ist eine Interpretation der Daten auch Monate nach der Studie möglich. Ein zentrales Rechtemanagement regelt Nutzungsrechte auf Studien- oder Datensatzebene. Datenzugriffe werden dokumentiert und auf Bedarf per E-Mail gemeldet. Zusätzlich ist die HMDP mit einer Workflow Engine verknüpft, wo Abläufe zur Datenverarbeitung zentral und wiederverwendbar definiert werden können. Die Installation auf eigenen oder cloudbasierten Server erfolgt einfach über Docker. Neben Installations- und Schulungskosten fallen laufende Kosten an, die jedoch stark von der gewählten Infrastruktur und der Datenmenge abhängen.
Das Design der HDMP basiert auf den Erfahrungen aus über 15 Jahren organisationsübergreifender, interdisziplinärer und datenintensiver Forschung und wird bereits in mehreren Projekten eingesetzt. Eine Skalierung des Projektes auf Landes- oder Bundesebene wäre der nächste Schritt, um das Tool für das F&E-Management von interdisziplinären AI-Innovationen auf breiter Basis zur Verfügung zu stellen.
Mit der Human Motion Data Platform (HMDP) geht Salzburg Research einen Mittelweg. Sie ermöglicht es, Forschungsdaten aus unterschiedlichen Datenquellen schnell zu planen, einfach in das Projekt zu integrieren, nachvollziehbar zu analysieren, und nachhaltig zu archivieren. Erreicht wird dies, indem Datenqualität über den gesamten Forschungsdatenlebenszyklus gemanagt wird. Im Fokus steht das Data Wrangling. Dabei werden gerade gewonnene Daten von den verschiedenen Messinstrumenten (z.B. IoT Sensoren, Laborgeräte, Fragebögen, etc.) heruntergeladen, dokumentiert und organisiert, bevor sie mit dem Projektkonsortium geteilt werden können. Fehler in dieser Phase führen zu irreparablem Verlust der Datenqualität, was sich negativ auf den darauffolgenden Datenanalyseprozess auswirkt.
Ein projektweiter Datenkatalog macht alle Datenobjekte und deren Metadaten auffindbar. Katalogeinträge sind verknüpft mit Studienprotokollen und den Metadaten der benutzten Messinstrumente. Damit ist eine Interpretation der Daten auch Monate nach der Studie möglich. Ein zentrales Rechtemanagement regelt Nutzungsrechte auf Studien- oder Datensatzebene. Datenzugriffe werden dokumentiert und auf Bedarf per E-Mail gemeldet. Zusätzlich ist die HMDP mit einer Workflow Engine verknüpft, wo Abläufe zur Datenverarbeitung zentral und wiederverwendbar definiert werden können. Die Installation auf eigenen oder cloudbasierten Server erfolgt einfach über Docker. Neben Installations- und Schulungskosten fallen laufende Kosten an, die jedoch stark von der gewählten Infrastruktur und der Datenmenge abhängen.
Das Design der HDMP basiert auf den Erfahrungen aus über 15 Jahren organisationsübergreifender, interdisziplinärer und datenintensiver Forschung und wird bereits in mehreren Projekten eingesetzt. Eine Skalierung des Projektes auf Landes- oder Bundesebene wäre der nächste Schritt, um das Tool für das F&E-Management von interdisziplinären AI-Innovationen auf breiter Basis zur Verfügung zu stellen.
Added value
Benefits für das BMK:
(1) Stärkung des Forschungsstandorts Österreich und Wettbewerbsvorteil im Bereich Forschungsdatenmanagement sowie F&E-Management von AI-Innovationen
(2) Empfehlung für Datenkreise eines DGSVO-konformen Forschungsdatenmanagements für interdisziplinäre Forschungsprojekte
(3) Nationale Forschungsdateninfrastruktur
(4) Förderung der interdisziplinären Forschungsarbeit und Umgang mit Forschungsdaten
Benefits für Datenanbieter (Forschungsorganisationen und Unternehmen):
(1) Integrierte rechtliche Vereinbarung und Regelung zur gemeinsamen Nutzung von Daten
(2) Kontrolle über Datenveröffentlichung und Datenverwendung
(3) Digitale Langzeitarchivierung
(4) Möglichkeit der Abhaltung von Datathons oder Hackathons durch automatisierte Data-Pipelines
Benefits für Datensuchende (Forschungsorganisationen und Unternehmen):
(1) Nachvollziehbare Datendokumentation
(2) Kontaktierung der an Datensammlung beteiligten Personen
(3) Nutzung von bereits genierten (Referenz-)Datensätze für Innovationsvorhaben/Forschungsvorhaben
(1) Stärkung des Forschungsstandorts Österreich und Wettbewerbsvorteil im Bereich Forschungsdatenmanagement sowie F&E-Management von AI-Innovationen
(2) Empfehlung für Datenkreise eines DGSVO-konformen Forschungsdatenmanagements für interdisziplinäre Forschungsprojekte
(3) Nationale Forschungsdateninfrastruktur
(4) Förderung der interdisziplinären Forschungsarbeit und Umgang mit Forschungsdaten
Benefits für Datenanbieter (Forschungsorganisationen und Unternehmen):
(1) Integrierte rechtliche Vereinbarung und Regelung zur gemeinsamen Nutzung von Daten
(2) Kontrolle über Datenveröffentlichung und Datenverwendung
(3) Digitale Langzeitarchivierung
(4) Möglichkeit der Abhaltung von Datathons oder Hackathons durch automatisierte Data-Pipelines
Benefits für Datensuchende (Forschungsorganisationen und Unternehmen):
(1) Nachvollziehbare Datendokumentation
(2) Kontaktierung der an Datensammlung beteiligten Personen
(3) Nutzung von bereits genierten (Referenz-)Datensätze für Innovationsvorhaben/Forschungsvorhaben
Files & Info
Queries & Comments
Solutions already submitted
Cookies
We use cookies to make sure we give you the best experience on our website.
Find out more under "Collection of access data, log files and cookies" in our Privacy Policy.
Please log in if you would like to leave feedback.