Angaben zum gesamten Datensatz (globale Attribute)

In den globalen Attributen werden beschreibende Informationen abgelegt, die den gesamten Datensatz betreffen.

Es wird zwischen verpflichtenden Attributen (Kapitel 3.1) und optionalen (Kapitel 3.2) unterschieden. Die optionalen sind notwendig, um den unterschiedlichen Datenquellen/-disziplinen gerecht zu werden.

Attribute names sind grundsätzlich frei wählbar, es gibt allerdings bereits reservierte attribute names, die nur für definierte Zwecke verwendet werden dürfen. Diese sind:

add_offset, ancillary_variables, axis, bounds, calendar, cell_measures,
cell_methods, climatology, comment, compress, Conventions, coordinates,
_FillValue, flag_masks, flag_meanings, flag_values, formula_terms,
grid_mapping, history, institution, leap_month, leap_year, long_name,
missing_value, month_lengths, positive, references, scale_factor,
source, standard_error_multiplier, standard_name, title, units,
valid_max, valid_min, valid_range.

Zur Bedeutung siehe Appendix A in NetCDF Climate and Forecast (CF) Metadata Conventions7.

Verpflichtende globale Attribute

Global attributes sind die Metadaten der netCDF-Datei. Darin dürfen nur Informationen stecken, die für die Datei als Ganzes gelten.

Attribute

Description/Format

Specification/Example

Conventions

-vorgegeben-

CF-1.8

institution

-vorgegeben-

Helmholtz-Zentrum Hereon, Institute of Coastal Systems, Germany

title

beliebiger Text

source

steht für die Quelle und die Methode, mit der die Originaldaten produziert wurden. Bei Daten, die von Modellen erzeugt wurden, sollte hier der Name des Modells und die Version angegeben werden

  • cosmo_100614_4.14_clm2

  • int2lm_120824_1.20_clm1

  • remote sensing

  • in-situ

creation_date

Angabe bezieht sich auf das Erstellungsdatum der netCDF Datei

  • 2017-06-06T15:00:29Z

  • 2017-06-06T15:00:29+02:00

originator

Datensatzerzeuger

John Smith

contact

Person, E-Mail oder URL

http://coastmod.hereon.de

crs

coordinate reference system. WGS84 ist Default

EPSG:4326

7

http://cfconventions.org/cf-conventions/cf-conventions.html#attribute-appendix

Optionale globale Attribute

Optionale globale Attribute sind nicht für alle netCDF-Dateien am Hereon relevant, können aber in einzelnen Gruppen als notwendig vereinbart werden. Wenn das beschriebene Attribut relevant ist, dann sollte dieses Attribut aber einheitlich Verwendung finden.

Insbesondere sollte man für die Beschreibung des Dateiinhaltes das Attribut comment wählen.

carrier beschreibt den Träger auf dem eine Plattform temporär installiert ist, also z.B. RV Prandtl.

In COSYNA ist das Attribut platform verpflichtend und in der Regel vorgegeben. Ein Beispiel für platform wäre „Ferrybox on RV Polarstern“.

lineage beschreibt die Abstammung einer netCDF-Datei. Dies ist in der Regel eine ursprüngliche Datei eines anderen Formats.

Die einzelnen Prozessierungsschritte sollte man in processingSteps benennen.

StartTime und StopTime bezeichnen den ersten und letzten Zeitwert und fungieren als schneller und einfacher Zugang zu diesen Werten, z.B. über OPeNDAP.

Im distribution_statement werden Rechte und Pflichten der Nutzer der Datei benannt, für den Fall, dass die Datei nach außen weitergegeben oder veröffentlicht wird. Der Inhalt sollte im jeweiligen Institut abgestimmt sein.

In history kann man direkt niederlegen, was mit der Datei gemacht wurde, um zum aktuellen Zustand zu kommen. Tools wie die CDOs oder NCOs dokumentieren Arbeitsschritte in history automatisch. Man kann hier auch auf eine externe Datei oder eine URL verweisen.

PI soll den verantwortlichen Wissenschaftler für das ganze Projekt benennen, zu dem diese Datei gehört.

Für die Beschreibung der geographischen Lage stehen folgende Attribute zur Verfügung: geospatial_lon_min/_max, geospatial_lat_min/_max oder Bbox . Sie sind z.B. für Abfragen von Metadatenkatalogen notwendig.

Attribute

Description/Format

Specification/Example

comment

Eine kurze Beschreibung des Dateiinhalts, also quasi ein Abstract.

campaign

Kampagnen ID (für Beobachtungsdaten)

„belawatt071“

experiment_id

Experiment ID (für Modelldaten)

“cD3_011_ERAi”

carrier

beliebiger Text

„RV Prandtl“

platform

beliebiger Text. Wenn COSYNA Plattform, dann zwingend der vorgegebene Name

„Scanfish01“

profileType

„DownCast“

lineage

Abstammung der Datei als beliebiger Text

processingSteps

beliebiger Text; Beispielformat: "{original data}{Plausibility check using defaults}{5-point median filter}{0.1-dbar block median}"

processingSoftware

Name und Version, bei Verwendung von mehreren Programmen durch „;“ trennen

„GALATON V0.97“

StartTime

„2007-03-13T07:35:10Z“

StopTime

„2007-03-13T07:40:28Z“

Distribution_statement

abgestimmter Text, siehe Beispiel A3

history

Hier soll eine Art Logbuch geführt sein. Dieses Logbuch kann eine externe Datei sein. Laut CF conventions: List of the applications that have modified the original data.

references

z.B. DOI

contact_email

E-Mailadresse (Hereon)

StartLatitude

Float

für Transekte relevant

54.7457933333333

StopLatitude

Float

für Transekte relevant

54.7451966666667

StartLongitude

Float

für Transekte relevant

8.30397666666667

StopLongitude

Float

für Transekte relevant

8.30919166666667

geographicName

„hoernumtief“

station

„KormoranHoernum“

castID

„CTD001DW“

PI

Regelung Vor- und Zuname

„Person“

operator

Regelung Vor- und Zuname

„Volker Schmidt“

contributor

Regelung Vor- und Zuname

„Anna Mayr, Tim Schmalbach“

forcing

„COSMO CLM 5.0“

forcingResolution

„0.11 degrees“

boundaryCondition

beliebiger Text

modelNest

„CD16“

geospatial_lon_min

Angaben in decimal degrees (float)

Longitude units = degrees east

5.3457

geospatial_lon_max

Data in decimal degrees (float) Longitude units = degrees east

10.1234

geospatial_lat_min

Data in decimal degrees (float)  Latitude units = degrees north

53.1234

geospatial_lat_max

Data in decimal degrees (float)  Latitude units = degrees north

56.1234

Bbox

alternativ zu geospatial_l*. Reihenfolge: lonMin, latMin, lonMax, latMax

5.3,53.1,10.1,56.1

imo_platform_code

Plattformcode der International Maritime Organisation

„9144263“

ices_platform_code

Plattformcode von ICES

„58LY“

licence

Lizenz unter der die Daten abgegeben werden

institution-ID

ROR (Research Organization Registry)

ROR: 03qjp1d79

Dimensionen (dimensions)

In netCDF-Files werden die Daten als mehrdimensionale Felder abgelegt. Entscheidendes Strukturelement sind dabei die dimensions. Hierüber wird die interne Koordinatenstruktur der Datensätze (variables) definiert. Sie beinhaltet Angaben zur Ausdehnung (nx,ny,nz) sowie zur Zeitdimension (time). Sie werden unter variables (s. Abschnitt 4.) erläutert.

  • Eine variable kann beliebig viele dimensions haben.

  • Alle dimensions müssen verschiedene names haben.

  • Eine Beschränkung auf 4 dimensions wird empfohlen.

  • Dimensions einer Variablen sollten in der relativen Ordnung Datum/Zeit, Höhe/Tiefe, Breite, Länge (T,Z,Y,X) angeordnet sein. Wo dies nicht möglich ist (z.B. bei Spektren), sind andere sinnvolle Anordnungen zu entwerfen.

Zusätzliche dimensions müssen links von (T,Z,Y,X) stehen.

Wenn Zeitreihen in netCDF-Files gespeichert werden, dann muss berücksichtigt werden, dass die Zeitreihe weitergeführt werden kann, indem neue Zeiten hinzugefügt werden. Die Dimension der Zeitvariable sollte „UNLIMITED“ sein, um das Erweitern von Zeitreihen problemlos sicherstellen zu können. Sie ist dann die sogenannte record dimension.