1. Daten
  2. Für die Zeitreihenanalyse und –prognose ist das Vorhandensein geeigneter Datenreihen von entscheidender Bedeutung. Alle Daten, die im Rahmen dieser Arbeit verwendet wurden, stammen aus vier verschiedenen Quellen: Die CO2-Daten, die im Mittelpunkt der Untersuchung stehen, wurden vom Fachbereich Biologie der Universität Osnabrück zur Verfügung gestellt, außerdem wurden verschiedene Wetterdaten als Zeitreihen von dem Fachbereich Gartenbau der Fachhochschule Osnabrück sowie vom Deutschen Wetterdienst verwendet. Eigene Datenreihen, die zur saisonalen Modellierung dienen, runden das Spektrum ab. Sie umfassen u.a. jahreszeitliche Schwankungen.

    In diesem Kapitel werden nun die einzelnen Zeitreihen und deren Quellen detailliert vorgestellt sowie die Methoden der Datenvorverarbeitung erläutert. Tabelle 2.2 am Ende dieses Kapitels zeigt eine Übersicht über die verwendeten Daten.

    1. Daten der Biologie
    2. Der Fachbereich Biologie der Universität Osnabrück betreibt am Westerberg (95m über NN; 58° 18‘ N, 8° 2‘ O) in der Arbeitsgruppe Ökologie seit 1981 regelmäßige Messungen des CO2-Gehalts der Luft. Ursprünglich im Rahmen einer Dissertation [For 93] verwendet, wurde die Anlage 1994 durch die heutige, modernere Meßstation ersetzt. Die Messungen erstreckten sich damals auf drei Klimazellen, in denen der Einfluß des CO2-Gehalts der Luft auf ökologische Systeme herausgefunden werden sollte. Seit 1986/1987 finden Außenmessungen der Luft statt.

      Die Messungen nimmt alle 30 Sekunden ein Ultra-Rot-Absorptions-Spektroskop (URAS) in 6 Meter Höhe über dem Erdboden vor. Der Meßbereich beträgt 0-1000 ppm, die Meßgenauigkeit ist mit Abweichungen von unter einem ppm recht hoch. Die Anlagen werden regelmäßig unter Einsatz von Eichgasen gewartet. Insgesamt sind drei Spektroskope im Einsatz, von denen zwei die Luft in den Klimazellen messen, während das dritte die Außenluft mißt. Die Meßwerte des letztgenannten finden in dieser Arbeit Verwendung.

      Abbildung 2.1 zeigt die Monatsmittelwerte der CO2-Konzentration in der Luft für den betrachteten Zeitraum, Abbildung 2.2 ein Histogramm der validen CO2-Werte für 1992-1996.

      Abbildung .1: Monatlich gemittelte CO2-Werte in Osnabrück (Westerberg)

      Der Übersicht über die Monatsmittelwerte kann man entnehmen, daß die CO2-Konzentrationen während der Phasen stärkerer Vegetationsaktivität (Sommer) geringer ist als während der Heizperiode im Winter, wenn größere CO2-Emissionen und mangelnde Vegetationsaktivität zusammen kommen. Einzig die Werte für Dezember 1993 und Januar 1994 fallen aus diesem Schema.

      Abbildung .2: Histogramm der CO2-Werte für den betrachteten Zeitraum

      Das Histogramm zeigt deutlich eine schräge Verteilung. Die Daten selbst weisen zum Teil erhebliche Lücken auf, insbesondere die Daten von 1992 und 1993. Eine Übersicht über die Fehlwerte der CO2-Zeitreihe liefert Tabelle 2.1. Es wird deutlich, daß für die Zeitreihenanalyse nur der Zeitraum vom 06.02.1992 bis zum 31.12.1996 in Frage kommt, da für die ersten 36 Tage im Jahr 1992 keine Meßwerte vorliegen. Problematisch ist auch eine Betrachtung des Aprils 1993, für den gar keine Werte vorhanden sind, sowie für September 1992 mit nur 5 validen Werten.

      Tabelle .1: Übersicht über fehlende Daten in der CO2-Zeitreihe

       

      Auf die Probleme, die sich aus den unvollständigen Daten insbesondere der CO2-Zeitreihe ergeben, wird in Kapitel 3 im Rahmen der Darstellung von Verfahren zur Zeitreihenprognose und –analyse genauer eingegangen.

    3. Daten des Deutschen Wetterdienstes
      1. Meßstation Kalkhügel
      2. Seit 1953 betreibt der Deutsche Wetterdienst eine meteorologische Meßstation in Osnabrück, im Stadtteil Kalkhügel (52° 15‘ 26" N, 8° 3‘ 16" O), deren Messung für diese Arbeit verwendet wurden. Sie liegt 95m über NN. Ihre geographische Lage zeichnet sich durch eine besondere Nähe (ca. 3,8 km Luftlinie) zur CO2-Meßstation aus. Mit dem Jahr 1992 begann die elektronische Aufzeichnung der in dieser Arbeit verwendeten Wetterdaten. Dies verspricht eine größere Genauigkeit insbesondere beim zeitlichen Abstand der Einzelmessungen.

        Unsicherheiten bzw. Meßungenauigkeiten sind vor allem bei dem Bedeckungsgrad gegeben, der ein reiner Schätzwert ist. Weiterhin ist der offizielle (elektronisch gemessene) Niederschlag etwas höher als der tatsächliche Wert, und Lufttemperatur, Windgeschwindigkeit und Windrichtung können minimal gegenüber dem Westerberg variieren. Diese Abweichungen werden bei der Temperatur durch unterschiedliche Sonneneinstrahlung verursacht, bei den Windmessungen vor allem durch lokal unterschiedliche topographische Beschaffenheit.

      3. Zeitraum 1992-1993

Für den Zeitraum von 1992-1993 stellte der Deutsche Wetterdienst folgende Daten als Stundenmittelwerte zur Verfügung:

 

Weiterhin lagen folgende Daten als Tageswerte vor:

 

Die Stundenwerte wurden zu Tageswerten aggregiert (siehe Abschnitt 2.5).

      1. Zeitraum 1994-1996

Die Wetterdaten für den Zeitraum von 1994-1996 wurden komplett als Stundenmittelwerte zur Verfügung gestellt:

Die Einheiten entsprechen denen des Zeitraums von 1992 bis 1993. Fehlwerte werden generell durch Werte ausgedrückt, die nicht im möglichen Wertebereich liegen (-99 für Windgeschwindigkeit, -999 für Temperatur etc.).

Die Fehlwerte in den Daten beschränken sich auf den Zeitraum von 1992-1993, die der Arbeit von Tilmanns [Til 93] entstammen. Besonders fallen hier folgende Zeiträume auf: Der Zeitraum vom 01.01.1992 bis 05.02.1992 mit 36 Fehlwerten und die 44 Tage ab dem 24.03.1993, welche beide auch in den CO2-Daten fehlen. Außerdem nicht valide sind die 65 (!) Tage ab dem 27.07.1992 und der Zeitraum vom 25.11.1992 bis zum Ende des Jahres 1992 (37 Werte).

    1. Daten der Fachhochschule Osnabrück

Der Fachbereich Gartenbau der Fachhochschule Osnabrück betreibt seit 1954 eine agrar-meterologische Meßstation (68m über NN). Dort werden täglich folgende Wetterdaten aufgezeichnet:

.

Dabei bezeichnet es den Sättigungsdampfdruck [mbar] und ea den aktuellen Dampfdruck [mbar], für den gilt ea = es × HR / 100, wobei HR die relative Luftfeuchtigkeit [%] ist, gemessen um 1430 Uhr. fH ist der sogenannte Haude-Proportionalitätsfaktor [mm/mbar× d], der mit der mittleren Monatstemperatur korreliert ist und tabelliert in der Fachliteratur zu finden ist. Sein Wertebereich beträgt für Deutschland 0,26–0,39. Es ergibt sich also folgende Formel:

Diese Zeitreihe wird mit HAUDE bezeichnet.

Die Zeitreihen Niederschlag und Temperatur liegen also sowohl vom Deutschen Wetterdienst als auch von der Fachhochschule vor. Sie werden im folgenden als NS-DWD und NS-FH bzw. TEMP-DWD und TEMP-FH bezeichnet.

    1. Weitere Daten

Weiterhin wurden zur Modellierung der Zeitabhängigkeit bzw. der Jahresperiode folgende Datenreihen generiert:

Diese Formeln bilden die unstetige JTG-Zeitreihe stetig auf das Intervall [-1..+1] ab.

Aufgrund der artifiziellen Natur dieser Datenreihen gibt es hier keine Fehlwerte.

    1. Datenvorverarbeitung
      1. Allgemeines
      2. Für die Verwendung in der Analyse und Prognose wurden die Windgeschwindigkeit auf [m/s], die Lufttemperatur auf [°C] und die Niederschlagshöhe auf [mm] skaliert. Außerdem konnten alle Datenreihen, von denen keine Tageswerte vorlagen (die CO2-Meßwerte sowie einige Daten des DWD), auf Tageswerte aggregiert werden. Zu diesem Zweck wurden für die meisten Zeitreihen die Mittelwerte der Stundenwerte gebildet, die pro Tag vorlagen. Ausnahmen bildeten die Niederschlagshöhe, die über den Tag aufsummiert wurde, und die Windrichtung, die aufgrund ihrer unstetigen Notation eine gesonderte Behandlung benötigte.

        Die Transformation bzw. Aggregation der Daten im Rahmen der Datenvorverarbeitung (auch der unter 2.5.2 beschriebenen Windrichtungs-Zeitreihe) wurde durch verschiedene Programme realisiert, die in der interpretierten Programmiersprache Perl 5.0 geschrieben wurden. Sie finden sich auf der CD-ROM (siehe Anhang 7.3).

        Ferner ist für die Verwendung der Datenreihen im Rahmen der neuronalen Modellierung mit SNNS eine Skalierung der Zeitreihen notwendig, bei der ein entsprechender Wertebereich eingestellt wird. Die Beschreibung dieser Skalierungen findet sich im Kapitel über Neuronale Netze (3.2).

      3. Die Windrichtungs-Zeitreihe

      Wie bereits in Kapitel 2.3 erwähnt, liegen die Meßwerte der Windrichtung in 10°-Segmenten vor, wobei folgende Zuordnung getroffen wird: Norden = 36, Osten = 9, Süden = 18, Westen = 27. Für Windstille wird Null als Meßwert notiert. Mit dieser Darstellung ergibt sich eine Unstetigkeitsstelle bei Windrichtungen aus Norden. Würde man die WR-Meßwerte nun einfach durch Mittelwertbildung der Stundenwerte aggregieren, würde das Ergebnis (die vorherrschende Windrichtung) verfälscht, sobald die Unstetigkeitsstelle im Bereich der gemessenen Windrichtungen liegt, d.h., wenn der Wind überwiegend aus Norden kommt (siehe Abbildung 2.3). Um dies zu vermeiden, wird zunächst das 10°-Segment bestimmt, das von den gemessenen Windrichtungen am weitesten entfernt ist und dieses als neue Unstetigkeitsstelle verwandt. Ausgehend von diesem Segment wird der Kreis transformiert, was garantiert, daß bei der anschließenden Mittelwertbildung die Unstetigkeitsstelle keine Rolle spielt. Ist die vorherrschende Windrichtung gefunden, wird diese zurücktransformiert. Die so erhaltene Zeitreihe wird mit WR bezeichnet.

      Um der Windstärke zu den jeweiligen Meßzeiten Rechnung zu tragen, wurde noch eine weitere Zeitreihe erstellt, deren Tageswerte analog zu den WR-Zeitreihe aggregiert wurden. Die einzelnen Tageswerte wurden jedoch vorher mit der entsprechenden Windrichtung gewichtet, d.h. multipliziert. So haben bei der Berechnung der vorherrschenden Windrichtung eines Tages die Meßwerte ein größeres Gewicht, zu denen eine größere Windstärke gehört. Die so erzeugte Zeitreihe wird mit WRG bezeichnet. Abbildung 2.3 zeigt die validen Meßwerte vom 22.11.1992, wobei in der linken Abbildung die zu den gemessenen Windrichtungen gehörenden Windstärken aufgetragen sind. Im rechten Teil werden die Ergebnisse der beiden vorgestellten Verfahren mit der einfachen Mittelwertbildung verglichen.

      Abbildung .3: Windrichtungen und –stärken für einen Tag mit den daraus resultierenden Tageswerten nach verschiedenen Verfahren

      Neben den Schwierigkeiten bei der Aggregation ist zu vermuten, daß die Unstetigkeit der Zeitreihe auch für die spätere Modellierung problematisch ist. Aus diesem Grund wurden die aggregierten Zeitreihen stetig auf ihre Polarkoordinaten abgebildet. Es ergeben sich jeweils zwei Zeitreihen, die den Sinus bzw. den Cosinus der WR- und WRG-Zeitreihe beinhalten. Diese werden im folgenden mit WRSIN und WRCOS bzw. WRGSIN und WRGCOS bezeichnet.

    2. Übersicht

Tabelle 2.2 bietet eine Übersicht über die verwendeten Datenreihen, deren Herkunft, Wertebereich und Anzahl valider Werte:

Tabelle .2: Übersicht über die verwendeten Datenreihen