Petabyte und das ist noch nicht alles
Das Large Hadron Collider (LHC), das beim CERN in der Schweiz derzeit gebaut wird, ist das größte wissenschaftliche Gerät auf unserm Planeten. 2007 wird es damit beginnen, jährlich rund 15 Petabytes (15 Millionen Gigabytes) an Daten zu produzieren. Weltweit werden Wissenschaftlerinnen und Wissenschaftler diese Daten analysieren.
Wie sieht die Datenspeicherung und -verteilung aus?
Das Ziel des LHC Computing Project (LCG) ist der Aufbau und die Pflege eines Datenspeichers und die Bereitstellung der entsprechenden Infrastruktur für die gesamte Gemeinde der Hochenergiephysik, die das LHC nutzen wird.
Die Daten aus den LHC-Experimenten werden über den Globus verteilt, und zwar in einem 4-Schichten-Modell. Die Resultate werden am CERN auf Band aufgezeichnet, Tier-0 des LCG. Die aufbereiteten Daten werden an Tier-1-Zentren verteilt, große Computerzentren mit hinlänglicher Speicherkapazität mit Rund-um-die-Uhr-Unterstützung für das Grid. Die Tier-1-Zentren stellen die Daten dann den Tier-2-Zentren zur Verfügung, von denen jedes aus ein oder mehreren kooperierenden Recheneinheiten besteht, die genügend Daten speichern können und angemessen viel Rechenstärke für spezielle Analyseaufgaben bereit stellen.
Die einzelne Wissenschaftlerin wird dann Zugriff darauf haben, und zwar durch Tier-3-Computerressourcen, die aus lokalen Clustern an der Uni oder sogar aus einzelnen PCs bestehen können, die einen regelmäßigen Zugang zum LCG bekommen.
Was sind die Ziele des Projekts?
- Entwicklung von Software, um die physikalische Anwendungssoftware in einem Grid zu unterstützen
- Entwicklung und Anwendung von Computerdiensten, basierend auf einem verteilten Gridmodell
- User- und Rechtemanagement in einer internationalen, heterogenen und nicht-zentralisierten Gridumgebung
- Akquisition, Installation und Kapazitätenplanung für die immense Anzahl von Hardware-Komponenten, die die physikalische Plattform für das LCG bilden
Und was hat das mit uns zu tun?
Die Entwicklung, der Aufbau und das Austesten neuer Grenzen in Sachen Grid auf der Basis einer anspruchsvollen Datenmenge wird unsern Umgang mit dem Computer wieder einmal in eine neue Dimension werfen. Ob das am Ende gut ist oder noch mehr unserer täglichen Zeit frisst, bleibt abzuwarten. Spannend ist es allemal.
Infos: http://lcg.web.cern.ch/LCG/
Maria
von Maria