In der Wissenschaft liefern große Experimente und Simulationen immer mehr Daten. Der Weg von den Daten und Informationen hin zu Erkenntnissen und Wissen benötigt jedoch auch Speicher- und Analysemöglichkeiten einer neuen Qualität. Die Helmholtz-Gemeinschaft übernimmt nun die Vorreiterrolle, um Daten dauerhaft, sicher und nachnutzbar speichern zu können. Zur Bewältigung von Big Data in der Wissenschaft hat sie dazu die durch das KIT koordinierte Helmholtz Data Federation (HDF) gegründet. Rund 49,5 Millionen Euro sollen in den nächsten fünf Jahren in multi-thematische Datenzentren und modernes Datenmanagement investiert werden.
„Eine zukunftsfähige Dateninfrastruktur ist das Rückgrat des Forschungsstandorts Deutschland“, unterstreicht der Präsident des KIT, Professor Holger Hanselka. „Um die großen Herausforderungen Energie, Mobilität und Information zu lösen, braucht es die Fähigkeit aus Big Data schnell Smart Data zu machen. Am KIT als der Forschungsuniversität in der Helmholtz-Gemeinschaft sind die dazu notwendigen Kompetenzen verknüpft.“
„Die Helmholtz-Zentren betonen ihre Bereitschaft, Forschungsdaten in geeigneten Dateninfrastrukturen langfristig zu bewahren und zur Nachnutzung für Wissenschaft und Gesellschaft so offen wie möglich zugänglich zu machen“, sagt Professor Otmar D. Wiestler, Präsident der Helmholtz-Gemeinschaft.
„In der Helmholtz Data Federation schließen sich Deutschlands führende Datenzentren zusammen, um die Ströme an Forschungsdaten aus den verschiedenen Wissenschaftsdisziplinen geordnet zu speichern, miteinander zu verknüpfen und einer gemeinsamen Nutzung zuzuführen“, freut sich Professor Achim Streit vom KIT, Koordinator von HDF. „Die HDF könnte so zur Blaupause für die datenintensive Forschung in Deutschland und Europa werden, ein offener Hafen für den Zugang zu und den Umschlag von Forschungsdaten.“
Die HDF ist ein zentraler Baustein des jüngst verabschiedeten Positionspapiers der Helmholtz-Gemeinschaft zum Umgang mit Forschungsdaten mit dem Titel „Die Ressource Information besser nutzbar machen!“. Durch den sicheren Zusammenschluss (Föderation) und Ausbau von multithematischen Datenzentren wird die HDF es datenintensiven Wissenschafts-Communities ermöglichen, wissenschaftliche Daten sichtbar zu machen, unter Beibehaltung der Datenhoheit zu teilen, über Disziplingrenzen hinweg zu nutzen und zuverlässig zu archivieren. Die Föderation basiert auf drei Kernelementen: innovative Software für das Forschungsdatenmanagement, exzellente Benutzerunterstützung und topaktuelle Speicher- und Analyse-Hardware. Dazu werden mittelfristig Investitionen bei den Partnern in Speicher im zweistelligen Petabyte-Bereich und in zehntausende Computerkerne für Datenanalyse und -management durchgeführt. Dafür sind aus Mitteln der strategischen Ausbauinvestitionen in der Helmholtz-Gemeinschaft bis 2021 derzeit 49,5 Millionen Euro eingeplant.
Partner der HDF in der ersten Phase sind sechs Zentren aus fünf Forschungsbereichen der Helmholtz-Gemeinschaft: Alfred-Wegener-Institut Helmholtz-Zentrum für Polar- und Meeresforschung (Erde und Umwelt), Deutsches Elektronen-Synchrotron DESY und GSI Helmholtzzentrum für Schwerionenforschung (beide Materie), Deutsches Krebsforschungszentrum (Gesundheit), Forschungszentrum Jülich und Karlsruher Institut für Technologie (beide Energie, Schlüsseltechnologien, Materie, Erde und Umwelt). Die HDF stellt eine Keimzelle für eine Wissenschaftsorganisationen-übergreifende nationale Forschungsdateninfrastruktur (NFDI) dar, die offen für Nutzer im gesamten deutschen Wissenschaftssystem ist und durch internationale Verbindungen kompatibel mit der zukünftigen European Open Science Cloud (EOSC) sein wird.
Das KIT betreibt bereits einige Infrastrukturen für große Datenmengen. Das Smart Data Innovation Lab SDIL stellt bundesweit eine Forschungsplattform mit modernsten Analysefunktionen für Unternehmen bereit. Das Smart Data Solution Center Baden-Württemberg SDSC unterstützt kleine und mittelständische Unternehmen aus der Region beim Zugang zu Smart Data Technologien. Das Datenzentrum GridKa ist Teil des weltweit verteilten Netzwerkes für das europäische Teilchenbeschleunigerzentrum CERN. Mit der Large-Scale Data Facility – LSDF für die Wissenschaft im Land Baden-Württemberg und der Initiative Large-Scale Data Management and Analysis – LSDMA der Helmholtz Gemeinschaft hat das KIT bereits entscheidende Grundlagen für die Koordinatorrolle der HDF gelegt. Darüber hinaus befassen sich Informatik-Institute am KIT mit Analysemethoden, Auswertealgorithmen und Datensicherheit.
Forschungsdaten-Projekte des KIT:
http://www.smart-data-solution-center.de/
http://www.gridka.de/cgi-bin/frame.pl?seite=/welcome.html
https://www.scc.kit.edu/forschung/lsdf.php
http://www.helmholtz-lsdma.de/
Als „Die Forschungsuniversität in der Helmholtz-Gemeinschaft“ schafft und vermittelt das KIT Wissen für Gesellschaft und Umwelt. Ziel ist es, zu den globalen Herausforderungen maßgebliche Beiträge in den Feldern Energie, Mobilität und Information zu leisten. Dazu arbeiten rund 10 000 Mitarbeiterinnen und Mitarbeiter auf einer breiten disziplinären Basis in Natur-, Ingenieur-, Wirtschafts- sowie Geistes- und Sozialwissenschaften zusammen. Seine 22 800 Studierenden bereitet das KIT durch ein forschungsorientiertes universitäres Studium auf verantwortungsvolle Aufgaben in Gesellschaft, Wirtschaft und Wissenschaft vor. Die Innovationstätigkeit am KIT schlägt die Brücke zwischen Erkenntnis und Anwendung zum gesellschaftlichen Nutzen, wirtschaftlichen Wohlstand und Erhalt unserer natürlichen Lebensgrundlagen. Das KIT ist eine der deutschen Exzellenzuniversitäten.