26. November 2019

Nachvollziehbare Datenqualität: Erfolgsfaktor für Open Science

Manuel Kugler - Digitalisierung

Open Science fördert die Schaffung neuen Wissens und den Zugang zu Forschungsergebnissen. Die Verwaltung von Forschungsdaten ist dabei eine grosse Herausforderung. Gemeinsam mit SWITCH untersucht die SATW bestehende Standards und Massnahmen, um den Austausch von Daten unter Forschenden zu vereinfachen.

Im Zeitalter von Big Data generiert jeder Mensch pro Tag hunderte Megabyte Daten, Tendenz steigend. Die Anforderungen an diese sind im Allgemeinen relativ gering und der Grossteil wird kaum wiederverwendet. In der Forschung, wo die Gewinnung aufgrund teurer Messgeräte oder aufwändiger Befragungen kostspielig sein kann, sollte das anders sein. Forschungsdaten breit zugänglich zu machen, ist ein Ziel der Open-Science-Bewegung und im Speziellen von Open Data.

Daten müssen FAIR sein

Die Verwaltung von Forschungsdaten stellt die internationale Wissenschaftsgemeinschaft vor unterschiedliche Herausforderungen. Um diese zu meistern, gibt es aktuell diverse Initiativen, auch in der Schweiz. So hat sich der Schweizerische Nationalfonds SNF verpflichtet, von der Öffentlichkeit finanzierte Forschung möglichst kostenlos öffentlich zugänglich zu machen. swissuniversities erarbeitet ein Open-Science-Programm, damit Schweizer Hochschulen Forschungsdaten wiederverwenden und verbreiten können. Daran sind auch die Akademien der Wissenschaften Schweiz beteiligt, die in ihrem kürzlich publizierten Factsheet Empfehlungen zur Förderung von Open Access und Open Data abgeben. Die zentralen Prinzipien dieser Initiativen lassen sich mit dem Akronym FAIR zusammenfassen: Auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reusable).

Dokumentation von Forschungsdaten hängt von der jeweiligen Wissenschaft ab

Für Austausch und Wiederverwendung von Forschungsdaten ist eine nachvollziehbare Datenqualität zentral. Forschende müssen wissen, wie Rohdaten prozessiert wurden und Gewissheit haben, dass diese nicht manipuliert wurden. Dies verlangt nach einer entsprechenden Dokumentation, etwa in Form von Metadaten. Besonders wichtig ist dies, wenn Daten aus unterschiedlichen Forschungsrichtungen zusammengeführt werden. Da in den jeweiligen Wissenschaften unterschiedliche Daten anfallen, kommen auch andere Beschreibungsmerkmale zur Anwendung.

Nachvollziehbare Datenqualität für ein Forschungsdaten-Konnektom

Die Stiftung SWITCH hat jüngst die SWITCH Innovation Labs lanciert – Plattformen für die Zusammenarbeit mit Hochschulpartnern. Um das Schweizer Open-Science-Ökosystem und die Erstellung eines Forschungsdaten-Konnektoms zu fördern, wurden zwei Labs definiert: «Nachvollziehbare Datenqualität» und «Technologien für ein Forschungsdaten-Konnektom». Für das erste Lab wurde die SATW beauftragt. Verständliche Metriken für die Qualität von Daten sind eine Voraussetzung, um Forschungsdaten disziplinenübergreifend teilen zu können.

Neben neuen Forschungsfragen und Erkenntnissen ermöglicht eine nachvollziehbare Datenqualität eine bessere Reproduzierbarkeit von Resultaten. Bis anhin kann dies sehr aufwändig oder gar unmöglich sein. Allerdings kann die Forderung, Forschungsdaten offenzulegen und zu teilen, bei Forschenden auch Widerstand auslösen. Denn dadurch steigt das Risiko, dass Fehler in der Arbeit aufgedeckt und damit die Reputation der betroffenen Forschenden oder ihrer Institutionen beschädigt wird. Zudem darf die Dokumentation keinen wesentlichen Zusatzaufwand generieren – damit sich Forschende auf ihre Kernaufgaben konzentrieren können.

Expertenbefragung dokumentiert den Stand des Wissens

Die SATW sammelt mit Hilfe einer Expertenbefragung den Stand des Wissens und Massnahmen für eine breit abgestützte, nachvollziehbare Datenqualität in unterschiedlichen Forschungsbereichen. Dies in der Annahme, dass einzelne Disziplinen solche Aspekte unterschiedlich stark berücksichtigen und verschiedene Standards anwenden. Im Rahmen der Umfrage werden nationale Bedürfnisse und Probleme erfasst. Erste Resultate werden für Ende 2019 erwartet, allfällige Folgeaktivitäten werden ab 2020 initiiert.

Auskunft

Manuel Kugler, Leiter Schwerpunktprogramme Advanced Manufacturing und Künstliche Intelligenz, Tel. +41 44 226 50 21, manuel.kugler(at)satw.ch

Weitere Beiträge zum Thema Digitalisierung:

New comment

0 comments