Angaben zum gesamten Datensatz (globale Attribute)
In den globalen Attributen werden beschreibende Informationen abgelegt, die den gesamten Datensatz betreffen.
Es wird zwischen verpflichtenden Attributen (Kapitel 3.1) und optionalen (Kapitel 3.2) unterschieden. Die optionalen sind notwendig, um den unterschiedlichen Datenquellen/-disziplinen gerecht zu werden.
Attribute names sind grundsätzlich frei wählbar, es gibt allerdings bereits reservierte attribute names, die nur für definierte Zwecke verwendet werden dürfen. Diese sind:
add_offset, ancillary_variables, axis, bounds, calendar, cell_measures,
cell_methods, climatology, comment, compress, Conventions, coordinates,
_FillValue, flag_masks, flag_meanings, flag_values, formula_terms,
grid_mapping, history, institution, leap_month, leap_year, long_name,
missing_value, month_lengths, positive, references, scale_factor,
source, standard_error_multiplier, standard_name, title, units,
valid_max, valid_min, valid_range.
Zur Bedeutung siehe Appendix A in NetCDF Climate and Forecast (CF) Metadata Conventions7.
Verpflichtende globale Attribute
Global attributes sind die Metadaten der netCDF-Datei. Darin dürfen nur Informationen stecken, die für die Datei als Ganzes gelten.
Attribute |
Description/Format |
Specification/Example |
---|---|---|
-vorgegeben- |
CF-1.8 |
|
-vorgegeben- |
Helmholtz-Zentrum Hereon, Institute of Coastal Systems, Germany |
|
beliebiger Text |
||
steht für die Quelle und die Methode, mit der die Originaldaten produziert wurden. Bei Daten, die von Modellen erzeugt wurden, sollte hier der Name des Modells und die Version angegeben werden |
|
|
Angabe bezieht sich auf das Erstellungsdatum der netCDF Datei |
|
|
Datensatzerzeuger |
John Smith |
|
Person, E-Mail oder URL |
||
coordinate reference system. WGS84 ist Default |
EPSG:4326 |
Optionale globale Attribute
Optionale globale Attribute sind nicht für alle netCDF-Dateien am Hereon relevant, können aber in einzelnen Gruppen als notwendig vereinbart werden. Wenn das beschriebene Attribut relevant ist, dann sollte dieses Attribut aber einheitlich Verwendung finden.
Insbesondere sollte man für die Beschreibung des Dateiinhaltes das Attribut comment wählen.
carrier beschreibt den Träger auf dem eine Plattform temporär installiert ist, also z.B. RV Prandtl.
In COSYNA ist das Attribut platform verpflichtend und in der Regel vorgegeben. Ein Beispiel für platform wäre „Ferrybox on RV Polarstern“.
lineage beschreibt die Abstammung einer netCDF-Datei. Dies ist in der Regel eine ursprüngliche Datei eines anderen Formats.
Die einzelnen Prozessierungsschritte sollte man in processingSteps benennen.
StartTime und StopTime bezeichnen den ersten und letzten Zeitwert und fungieren als schneller und einfacher Zugang zu diesen Werten, z.B. über OPeNDAP.
Im distribution_statement werden Rechte und Pflichten der Nutzer der Datei benannt, für den Fall, dass die Datei nach außen weitergegeben oder veröffentlicht wird. Der Inhalt sollte im jeweiligen Institut abgestimmt sein.
In history kann man direkt niederlegen, was mit der Datei gemacht wurde, um zum aktuellen Zustand zu kommen. Tools wie die CDOs oder NCOs dokumentieren Arbeitsschritte in history automatisch. Man kann hier auch auf eine externe Datei oder eine URL verweisen.
PI soll den verantwortlichen Wissenschaftler für das ganze Projekt benennen, zu dem diese Datei gehört.
Für die Beschreibung der geographischen Lage stehen folgende Attribute zur Verfügung: geospatial_lon_min/_max, geospatial_lat_min/_max oder Bbox . Sie sind z.B. für Abfragen von Metadatenkatalogen notwendig.
Attribute |
Description/Format |
Specification/Example |
---|---|---|
Eine kurze Beschreibung des Dateiinhalts, also quasi ein Abstract. |
||
Kampagnen ID (für Beobachtungsdaten) |
„belawatt071“ |
|
Experiment ID (für Modelldaten) |
“cD3_011_ERAi” |
|
beliebiger Text |
„RV Prandtl“ |
|
beliebiger Text. Wenn COSYNA Plattform, dann zwingend der vorgegebene Name |
„Scanfish01“ |
|
„DownCast“ |
||
Abstammung der Datei als beliebiger Text |
||
beliebiger Text; Beispielformat: |
||
Name und Version, bei Verwendung von mehreren Programmen durch „;“ trennen |
„GALATON V0.97“ |
|
„2007-03-13T07:35:10Z“ |
||
„2007-03-13T07:40:28Z“ |
||
abgestimmter Text, siehe Beispiel A3 |
||
Hier soll eine Art Logbuch geführt sein. Dieses Logbuch kann eine externe Datei sein. Laut CF conventions: List of the applications that have modified the original data. |
||
z.B. DOI |
||
E-Mailadresse (Hereon) |
||
Float für Transekte relevant |
54.7457933333333 |
|
Float für Transekte relevant |
54.7451966666667 |
|
Float für Transekte relevant |
8.30397666666667 |
|
Float für Transekte relevant |
8.30919166666667 |
|
„hoernumtief“ |
||
„KormoranHoernum“ |
||
„CTD001DW“ |
||
Regelung Vor- und Zuname |
„Person“ |
|
Regelung Vor- und Zuname |
„Volker Schmidt“ |
|
Regelung Vor- und Zuname |
„Anna Mayr, Tim Schmalbach“ |
|
„COSMO CLM 5.0“ |
||
„0.11 degrees“ |
||
beliebiger Text |
||
„CD16“ |
||
Angaben in decimal degrees (float) Longitude units = degrees east |
5.3457 |
|
Data in decimal degrees (float) Longitude units = degrees east |
10.1234 |
|
Data in decimal degrees (float) Latitude units = degrees north |
53.1234 |
|
Data in decimal degrees (float) Latitude units = degrees north |
56.1234 |
|
alternativ zu geospatial_l*. Reihenfolge: lonMin, latMin, lonMax, latMax |
5.3,53.1,10.1,56.1 |
|
Plattformcode der International Maritime Organisation |
„9144263“ |
|
Plattformcode von ICES |
„58LY“ |
|
Lizenz unter der die Daten abgegeben werden |
||
ROR (Research Organization Registry) |
ROR: 03qjp1d79 |
Dimensionen (dimensions)
In netCDF-Files werden die Daten als mehrdimensionale Felder abgelegt. Entscheidendes Strukturelement sind dabei die dimensions. Hierüber wird die interne Koordinatenstruktur der Datensätze (variables) definiert. Sie beinhaltet Angaben zur Ausdehnung (nx,ny,nz) sowie zur Zeitdimension (time). Sie werden unter variables (s. Abschnitt 4.) erläutert.
Eine variable kann beliebig viele dimensions haben.
Alle dimensions müssen verschiedene names haben.
Eine Beschränkung auf 4 dimensions wird empfohlen.
Dimensions einer Variablen sollten in der relativen Ordnung Datum/Zeit, Höhe/Tiefe, Breite, Länge (T,Z,Y,X) angeordnet sein. Wo dies nicht möglich ist (z.B. bei Spektren), sind andere sinnvolle Anordnungen zu entwerfen.
Zusätzliche dimensions müssen links von (T,Z,Y,X) stehen.
Wenn Zeitreihen in netCDF-Files gespeichert werden, dann muss berücksichtigt werden, dass die Zeitreihe weitergeführt werden kann, indem neue Zeiten hinzugefügt werden. Die Dimension der Zeitvariable sollte „UNLIMITED“ sein, um das Erweitern von Zeitreihen problemlos sicherstellen zu können. Sie ist dann die sogenannte record dimension.