Blogeinträge
share
04.12.2019

Am Weihnachtsbaum die Lichter brennen

Alle Jahre wieder kommt nicht nur das Christuskind, sondern steht auch der alljährliche Kauf des Weihnachtsbaums an. Doch leere Verkaufsflächen könnten in Zukunft immer häufiger eine böse Überraschung bieten. Wir zeigen Ihnen, warum das so ist und wollen mit unseren Prognosen helfen, diesem Alptraum vorzubeugen. Und so ganz nebenbei können Sie vielleicht noch das ein oder andere über Zeitreihen lernen.

Liebe Besucher des ProgBlogs,

die Weihnachtszeit steht mal wieder vor der Tür und auch wir von prognostica bereiten uns auf die ersten Adventstage vor. Doch anders als klassische Liebhaber von Lichterketten und Spekulatius können wir auch jetzt die Gedanken nicht von der Zukunft lassen. Zeitreihen und Vorhersagen sind eben unsere Leidenschaft. Und hier hält die schönste Zeit des Jahres einige interessante Gedankenexperimente bereit: Haben Sie sich auch schon mal gefragt, wie die Nachfrage nach Nordmanntannen über die Wintermonate steigt und fällt? Nein? Dann sind Sie hier richtig gelandet: Wir liefern Ihnen nicht nur die Frage, sondern auch eine Antwort darauf. Und so ganz nebenbei lernen Sie vielleicht noch das ein oder andere über Vorhersagen…

Begehrtes Grün

Doch nun erst einmal der Reihe nach: Warum ist diese Frage überhaupt interessant? Immer häufiger auftretende Dürreperioden setzen vor allem neugepflanzten Nadelbäumen zu. Das könnte, vielleicht nicht dieses Jahr, aber in naher Zukunft zu einer Verknappung des Angebots führen. Obwohl es unwahrscheinlich ist, dass wir in dieser Zukunft an Heiligabend ohne Grün und Lametta Geschenke auspacken – spärlich besetzte oder gar leere Verkaufsflächen dürften Verbrauchern immer häufiger begegnen. Eine Trendanalyse kann Aufschluss darüber geben, wann die jährliche Nachfrage normalerweise in die Höhe schießt. Als Blogleser sind Sie mit uns also auch im Weihnachtsgeschäft der Konkurrenz stets einen Schritt voraus.

Den Trend verstehen

Wie nähern wir uns dieser Problemstellung also an? Stellvertretend für die Nachfrage nach Nordmanntannen verwenden wir die Entwicklung der Google Trends. Dieser Statistikservice des Weltkonzerns mit den bunten Lettern normt die Anzahl der Suchanfragen zwischen 100 für den Tag oder die Woche mit der höchsten Anzahl an Suchanfragen, 50 für den Zeitraum mit der Hälfte der Anfragen des Maximums und 0 für Tage mit (beinahe) keiner Anfrage. Schauen wir uns diese Statistik also einmal für die letzten fünf Jahre etwas genauer an:

Wie zu erwarten liegt der Großteil der Suchanfragen in den Wochen vor Heiligabend. Dabei steigt die Nachfrage Anfang November erst einmal vorsichtig, bevor sie Mitte November anzieht und in der Woche vor Weihnachten Ihren Zenit erreicht. Vor dem Betrachten der Daten wäre außerdem die Vermutung nahe gelegen, dass das Maximum der Anfragen aufgrund einer steigenden Anzahl an Internetusern jährlich größer wird. Dies trifft in den Jahren 2014 bis 2017 auch zu, jedoch liegt der Peak im vergangenen Jahr deutlich niedriger. Auf der Suche nach Ursachen dafür fällt bei den Trends auf Länderebene auf, dass die Begeisterung für Nordmanntannen in den neuen Bundesländern nach wie vor ungebremst ist, während beispielsweise in Rheinland-Pfalz, Baden-Württemberg und Schleswig-Holstein die Zahl der Anfragen 2018 stark zurückgegangen ist und nur noch bei 50 oder niedriger liegt. Warum das so ist? Ehrlich gesagt können wir uns das auch nicht erklären. Falls Sie mehr wissen, schreiben Sie uns gerne in den Kommentaren unserer Social-Media-Auftritte.

Das Beispiel zeigt allerdings, was es mit einer Hierarchie in Zeitreihen auf sich hat. Das bedeutet, dass sich eine Zeitreihe oft aus vielen unterliegenden Zeitreihen zusammensetzt. Werden diese feingranularen Betrachtungen, hier auf Länderebene, zusammengesetzt, erhalten wir die aggregierte Nachfrage nach Nordmanntannen auf Bundesebene. Bei genügend Traffic wäre es selbstverständlich auch möglich, die Anfragen beispielsweise auf Stadtebene zu zählen und so noch detailliertere Informationen zu gewinnen. Aufgrund der geringeren Populationen auf dieser Ebene würden die Zeitreihen dabei vermutlich deutlich volatiler als auf der obigen Abbildung ausfallen.

Sprunghafter Anstieg wirft Rätsel auf

Interessant ist auch, dass im September dieses Jahres bereits ein kurzer Anstieg des Trends zu verzeichnen war. Hier sind wir über ähnliche Suchanfragen auf Spurensuche gegangen und konnten bei dem Suchbegriff ‘nordmanntanne georgien’ den angesprochenen Sprung entdecken. Der Zusammenhang dieser Begriffe liegt darin, dass die Samen der Nordmanntanne nur auf großen, alten Bäumen wachsen. Diese Samen kaufen deutsche Baumschulen zu einem großen Teil aus Georgien. Warum die Anfragen nun gerade im besagten Zeitraum von so großer Zahl waren, ist uns leider auch ein Rätsel. Diese Erklärung ist dabei nur unter Vorbehalt zu genießen, Google Trends liefert nur relative und keine absoluten Zahlen. Ob das Interesse für georgische Zapfenpflücker auch in absoluten Zahlen so groß ist, bleibt also Spekulation.

Methodenauswahl mit Hilfe des Backtestings

Nach unserer explorativen Datenanalyse im Kleinformat geht es nun an die Vorhersage. Wir verwenden die letzten fünf Jahre auf Wochenbasis als Grundlage. Die Struktur unserer Zeitreihe weist neben dem Ausreißer im September wie zu erwarten eine starke Saisonalität und keinen erkennbaren Trend auf. Daher eignen sich gleich eine ganze Reihe an statistischen und Machine-Learning-Methoden für die Vorhersage. Um herauszufinden, welche sich für die vorliegende Zeitreihe am besten eignet, verwenden wir das sogenannte Backtesting, bei dem für bereits vergangene Perioden Prognosen berechnet werden, die dann mit den tatsächlichen Werten verglichen werden können. Auf diese Weise schließen wir keines der Verfahren a priori aus, sondern wählen die Methode, die objektiv die besten Ergebnisse liefert.

Weihnachtstannen begehrter als im vergangenen Jahr?

Die Daten (abgerufen am 28.11.2019) schicken wir also in unser Vorhersagetool und erhalten das folgende Ergebnis:

Als bestes Modell wurde das ARIMA-Verfahren ermittelt, vor Mitbewerbern wie der Exponentiellen Glättung, Random Forest oder XGBoost. Eine so hohe Anzahl an Anfragen wie in 2016 und 2017 ist laut unserer Prognose nicht zu erwarten. Der höchste Wert in der Woche ab dem 15. Dezember liegt allerdings rund 10 Punkte über dem Maximum in 2018. Natürlich trifft eine Vorhersage selten ganz genau ein. Dafür haben wir den Prognosekorridor mit einem Konfidenzniveau von 95 Prozent eingezeichnet. Ein Prognosekonfidenzniveau von 95 Prozent bedeutet dabei, dass von 100 berechneten Prognoseintervallen im Mittel 95 die wahren (zukünftigen) Zeitreihenwerte enthalten. In etwa 5 Prozent der Fälle dagegen liegen die wahren Zeitreihenwerte außerhalb.

Eine Lösung für Anomalien

Übrigens: Wie sich der Ausreißer im September auf eine etwa ganzjährige Vorhersage mit ARIMA auswirken würde, sehen wir in dieser Grafik:

Der Ausreißer wird, wenn auch abgeschwächt, für das kommende Jahr wiederholt. Um dies zu vermeiden, gibt es beispielsweise die folgenden zwei Möglichkeiten: Einerseits den Ausreißer aus der Zeitreihe von vornherein zu entfernen. Andererseits könnte auch die für die Anomalie verantwortliche unterliegende Zeitreihe für ‘nordmanntanne georgien’ (s. o.) gesondert betrachtet werden, um den Ausreißer in den Griff zu kriegen.

Frohe Weihnachten!

Geschafft! - Mit vielen neuen Erkenntnissen schicken wir Sie guten Gewissens in die Weihnachtszeit. Das Jahr 2019 – unser erstes Blogjahr – endet damit auch für unser Blogteam. Wir bedanken uns bei unseren treuen Leserinnen und Lesern und wünschen Ihnen schon jetzt besinnliche Feiertage. Bis zum neuen Jahr!



Haben Sie Fragen oder Anregungen zum heutigen Blogbeitrag? Dann hinterlassen Sie uns einfach einen Kommentar auf Twitter, Xing oder LinkedIn oder schreiben Sie uns eine E-Mail an business.development@prognostica.de.

Ihnen schwirrt vor lauter Fachbegriffen der Kopf? Kein Problem, in diesem Blogbeitrag haben wir Fachausdrücke einfach erklärt:

Infobox:

Exponentielle Glättung: Das Verfahren der exponentiellen Glättung ist ein bewährtes Verfahren zur Analyse und Prognose von Zeitreihen, welches Niveau-, Trend- und (multiple) Saisonkomponenten in Betracht ziehen kann. Hierbei werden weiter zurückliegende Zeitreihenwerte üblicherweise weniger stark gewichtet als die jüngere Historie.

ARIMA: Ein ARIMA-Modell (ARIMA = Autoregressive integrated moving average) ist ein Modell zur Analyse und Prognose von Zeitreihen, in das vergangene Werte der Zeitreihe selbst sowie vergangene Fehlerterme eingehen. Die Analyse kann hierbei statt auf den Rohdaten auch auf (mehrfach) differenzierten Daten stattfinden. Saisonalitäten sowie exogene Einflussgrößen können in ARIMA-Modellen ebenfalls mitmodelliert werden.


Daten am 28. November 2019 abgerufen

Vorheriger Eintrag: prognostica und Softwareentwicklung
Nächster Eintrag: 7 Fragen an ... Felix, Werkstudent im Business Development von prognostica

Um über weitere Beiträge, bevorstehende Events und neue Produkte der prognostica informiert zu bleiben, melden Sie sich für unseren Newsletter an:

Jetzt für den Newsletter anmelden

Kontakt

prognostica GmbH
Berliner Platz 6
D-97080 Würzburg
P: +49 931 497 386 0

Ihr Partner für Predictive Analytics und Data Science.

Weitere Angaben, u. a. zum Datenschutz, finden Sie in unserem Impressum und unserer Datenschutzerklärung.

Folgen Sie uns!

© 2020 prognostica GmbH