Man kennt es von eigenen Überlegungen etwa an der Tankstelle oder an der Wertpapierbörse: Wüsste man, dass der Preis von Benzin oder einer anvisierten Aktie in naher Zukunft sinken wird, wäre die beste Strategie, mit dem Kauf (nach Möglichkeit) noch etwas zu warten. Zeigen die Preisprognosen nach oben, zahlt sich ein sofortiger Kauf aus. Selbiges gilt für den Rezyklat-Sektor: Die Profitabilität einer Produktion von beispielsweise ressourcenschonender Verpackungsfolie hängt nicht nur vom Preis der ausgewählten oder vorgeschriebenen Materialsorte ab, sondern auch davon, wie gut man die Preisentwicklung des wiederaufbereiteten Kunststoffs vorab abschätzen und entsprechend einkaufen kann. Nur wie bekommt man die Sicherheit, dass man schon die richtige Kaufentscheidung trifft? Kann man durch fundierte, datenbasierte Prognosen des zukünftigen Preises der Regranulatsorte vielleicht ein Stück weit Licht ins Dunkel bringen? Man kann! Wir erläutern am Beispiel der Vorhersage von Rezyklat-Preisen im Mai 2024 und unter Verwendung der Prognose-Software ‘future’ wie das geht.
Unser Ziel ist es, Prognosen für Rezyklatpreise zu erzeugen, die monatlich in den Recycario-Bericht von Peter Jetzer auf dem Blog “Kreislaufgold” eingehen. Dafür blicken wir zunächst auf die uns zur Verfügung stehende Datenbasis. Da wir die Preisprognose für die nächsten Monate erstellen und außerdem Einflussfaktoren hinzunehmen möchten, die ebenfalls auf Monatsbasis vorliegen, achten wir darauf, dass wir die historischen Rezyklatpreise auf Monatsbasis bekommen. In unserem Fall sorgt eine Aggregation des mittleren Preises für Rezyklate im Monat für eine lückenlose, gut gepflegte Zeitreihe auf Monatsbasis. Da wir es mit einer 2013 beginnenden Zeitreihe zu tun haben, ist eine weitere Grundvoraussetzung einer ausreichenden Länge der Zeitreihe von einigen Jahren ebenfalls gegeben. Der aktuellste Wert des mittleren Rezyklatpreises, der uns vorliegt, stammt aus dem Mai 2024. Insofern können wir Vorhersagen für Juni 2024, Juli 2024, usw. erstellen.
In einem ersten Schritt erstellen wir ausschließlich auf Basis der historischen Rezyklatpreise Prognosen, um einen Benchmark für die erzielbare Prognosegüte zu erhalten. Wir können dabei kalendarische Gegebenheiten wie eine Saisonalität oder ein Trendverhalten der Zeitreihe einbeziehen. Die Rezyklatpreise weisen, wie dies bei Preisen generell oft der Fall ist, keine sichtbare oder nachweisbare Saisonalität auf. Der Verlauf der Rezyklatpreise ist im Wesentlichen getrieben durch autoregressives Verhalten, d.h. die Preise der Vormonate haben einen starken Einfluss auf die Preise des aktuellen Monats, was sich in einem gewissen Trendverhalten der Zeitreihe widerspiegelt. Weitere, potenziell weniger leicht sichtbare Muster sind in unserem Fall nicht nachweisbar. Wir simulieren die historische Prognosegenauigkeit und stellen fest, dass wir auf diese Weise einen mittleren absoluten Prognosefehler von ca. 1,9 % für die 1-Schritt-Prognose - also für den Preis des nächsten Monats - erhalten.
Abbildung 1: Benchmark-Vorhersage der Rezyklatpreise ausschließlich auf Basis der historischen Rezyklatpreise.
Die Prognosegüte, die wir nur durch Nutzung der historischen Rezyklatpreise erzielen können, reicht uns jedoch nicht aus. Nicht zuletzt deswegen, weil es den dringenden Verdacht gibt, dass in der Menge an externen Einflussfaktoren möglicherweise treibende Faktoren für die Preisverläufe schlummern. Im Gespräch sind u.a. Preise von Primärkunststoffen, Preise ihrer Abfälle sowie allgemeine Wirtschaftsindikatoren. Auch dass politische Maßnahmen auf die Preisverläufe von Regranulaten Einfluss nehmen, ist leicht vorstellbar. Die folgende Abbildung gibt eine Übersicht über mögliche Treiber aus der wirtschaftlichen/konjunkturellen, marktspezifischen/technischen, ökologischen sowie regulativen Perspektive:
Abbildung 2: Übersicht über potenzielle Treiber und Einflussfaktoren der Marktpreise für Regranulate.
Da wir nur solche Einflussgrößen im Prognosemodell verarbeiten können, die eine quantitative Repräsentation besitzen, die mit der zu analysierenden Zeitreihe zusammenpasst - in diesem Fall heißt das, die gleiche Granularität und eine ausreichend lange, aktuelle Datenhistorie - überlassen wir die Interpretation des Einflusses von einmaligen und politischen Ereignissen auf die Rezyklatpreise dem Experten und konzentrieren uns auf die quantifizierten Faktoren. Haben wir unter allen vorhandenen, möglichen Faktoren diejenigen identifiziert, die prädiktive Kraft haben, können wir sie geeignet im Modell verwerten und dadurch präzisere Prognosen erhalten.
Den Einfluss von äußeren Einflussfaktoren auf die vorherzusagende Rezyklatpreis-Zeitreihe analysieren wir mit Hilfe des Moduls futureMATCHER der Prognose-Software future. Auf diese Weise können wir erreichen, dass die Einflussfaktoren mit dem idealen Gewicht und der idealen Wirkungsrichtung in das Prognosemodell eingehen. Zusammenhänge zwischen den Einflussfaktoren spielen hier ebenfalls eine Rolle, sodass wir Einflussgrößen nicht nur separat, sondern auch in Kombination und potenziell zeitversetzt betrachten. Obwohl wir beispielsweise vermutet hatten, dass sowohl die Preise der Primärkunststoffe als auch die Preise von deren Abfällen relevant sein könnten, stellt es sich letztendlich heraus, dass einer der beiden für die Prognose verzichtbar ist: Sie weisen eine dermaßen hohe Korrelation auf, dass es zu Kollinearität im Modell führt und es somit keinen Mehrwert für das Modell bringt, beide einzubeziehen. Im Gegenteil: Man erhält ein stabileres Prognosemodell, wenn man auf einen der beiden Faktoren verzichtet - zumindest im Falle von additiven Modellen, welche wir an dieser Stelle besonders im Visier haben. Letztendlich nehmen wir die Abfallpreise (“Waste”) mit einem zeitlichen Versatz von einem Monat (Lag 1) und einer positiven Wirkungsrichtung ins Modell auf, da diese eine leicht bessere Performance aufweisen.
In Kombination mit den Abfallpreisen finden wir im Business Confidence Indicator der OECD einen Einflussfaktor, bei dem wir ebenfalls eine Wirkung im Modell nachweisen konnten, und zwar ebenfalls mit einem positiven Zusammenhang zur Rezyklat-Zeitreihe. Dieser OECD-Indikator zum Business Confidence beruht auf Meinungsumfragen zur Entwicklung von Produktion, Aufträgen und Beständen von Fertigerzeugnissen in der Industrie und soll explizit Wendepunkte in der Wirtschaftstätigkeit vorwegnehmen können.1 Unsere Analysen zeigen, dass der Indikator dies im Falle der Rezyklatpreise auch tatsächlich leisten kann. Wie schon bei den Abfallpreisen können wir feststellen, dass der Indikator einen Vorlauf von einem Monat auf die Zielzeitreihe aufweist. Das ist auf den ersten Blick nicht viel, kann aber beim Kauf von großen Mengen eines Rohstoffs bereits einen entscheidenden Unterschied machen.
Abbildung 3: Rezyklatpreise mit den um ihren jeweiligen Vorlauf verschobenen Einflussfaktoren (Business Confidence Indicator der OECD und Abfallpreise)
Wir haben somit mit den Abfallpreisen und dem OECD-Indikator ausschlaggebende Faktoren und Träger relevanter Informationen für die Vorhersage von Trendwenden der Rezyklat-Zeitreihe gefunden und gehen diese nun im nächsten Schritt an.
Die Prognose erstellen wir mit Hilfe des Moduls futureFORECAST der Prognose-Software future. Darin treten mehrere verschiedene Prognosemodelle gegeneinander an und unter allen im vorliegenden Fall plausiblen Modellen wird mittels intelligenter Auswahlmechanismen dasjenige ausgesucht, welches die besten Ergebnisse liefert. Unter den getesteten Modellen befinden sich verschiedene Methoden aus dem Bereich der Statistik sowie des Machine Learnings, darunter einige von uns selbst entwickelte Verfahren. Dank der relativ langen Datenhistorie der Rezyklatpreis-Zeitreihe steht uns hier grundsätzlich eine große Anzahl an möglichen Vorhersagemethoden zur Verfügung. Allerdings möchten wir externe Einflussfaktoren integrieren (s.o.), so dass wir hier nur diejenigen Prognoseverfahren nutzen können, die eine Integration ermöglichen und nicht nur die reine Zeitreihenhistorie verarbeiten können. Bei den verbleibenden verwendbaren Prognoseverfahren unterstützt uns future bei der richtigen Art und Weise der Nutzung mittels intelligenter Mechanismen, z. B. sodass beispielsweise Modell- oder Hyperparameter im gewünschten Sinne ideal gewählt oder Ausreißer in gewisser Weise behandelt werden.
Wenn wir wollten, könnten wir uns mit der Frage beschäftigen, in welchem Sinne eigentlich all diese Einstellungen ideal getroffen werden sollten. Denn wir haben die Auswahl, die Modelle unter Zutun verschiedener Vorhersagegütemaße zu bewerten. In unserem Fall haben wir uns auf einen vielfach bewährten Score aus gewissen In-Sample- und Out-of-Sample-Kriterien verlassen. future ermöglicht ebenfalls, gewisse Vorhersageschritte stärker zu gewichten als andere. Hier haben wir den Vorhersageschritt 3, d.h. die Vorhersage für drei Monate im Voraus, besonders stark gewichtet. Letztendlich führt der Einbezug von Einflussfaktoren bei unserem Anwendungsfall dazu, dass wir den Prognosefehler auf 1,5 % reduzieren können - was einer Reduktion des Fehlers um mehr als 20 % entspricht!
Neben Punktprognosen - einer Art Best Guess für die zukünftigen Regranulatpreise - lassen wir auch Prognoseintervalle mit ausgeben, wodurch wir ein Gefühl für den Anteil an Prognoseunsicherheit bekommen, der nicht erklärbar ist. Diese in Zahlen überführte Prognoseunsicherheit spiegelt sich in den oberen und unteren Grenzen von Prognoseintervallen wider. Gewählt haben wir hierbei als Prognose-Konfidenzniveau den Industriestandard 95%. Gut sichtbar ist, dass die Prognoseintervalle für weiter in der Zukunft liegende Monate breiter werden. Inhaltlich verdeutlichen die Prognoseintervalle ein Verhalten der Rezyklatpreise, das nicht erklärbar bzw. durch Indikatoren oder weitere Einflussfaktoren nicht beschreibbar bist: Das Umfeld ist durchaus komplex, Einflüsse gibt es in einer Vielzahl, welche und wie stark - auch das unterliegt oft Änderungen. Dass diese oft nicht quantifizierbar sind, zeigt beispielsweise die von Peter Jetzer im Recycario-Bericht von April 2024 erwähnte Nicht-Befahrbarkeit von Containerschiffen des Golfs von Aden. Diese Unsicherheit, die der Datenjournalist mit dem Fokus auf Kunststoffe unter Zuhilfenahme seines Fachwissens teils begründet und von der ein kleiner Rest aber vermutlich auch auf Zufall zurückzuführen ist, bekommt man in den Prognosen nicht vollständig weg. Wir können sie aber immerhin in Form von Prognoseintervallen transparent machen.
Abbildung 4: Punktprognosen und Prognoseintervall zum Prognose-Konfidenzniveau 95 % für die Rezyklatpreise unter dem Prognosemodell mit Einflussfaktoren
Wir gehen noch einen Schritt weiter, um die ungewisse Zukunft der Rezyklatpreise mit Hilfe von Prognosen ein Stück greifbarer zu machen. Unsere Analyse der Einflussfaktoren “Abfallpreis” und “OECD-Indikator” hat bei beiden einen Vorlauf von einem Monat ergeben. Wenn wir bei beiden also die Werte bis einschließlich Mai 2024 kennen, können wir bei ihrer Verwendung eine Prognose bis Juni 2024 erstellen. Schon mal gut, aber weiter in die Zukunft wäre uns lieber! Wir wollen uns im neuen und daher noch unsicheren Rezyklatmarkt zurechtfinden. Auch nicht einfach einzuschätzen, aber immerhin mit längeren Erfahrungswerten verbunden, sind unsere Einflussfaktoren. Beispielsweise könnten Experten basierend auf den aktuellen wirtschaftlichen und politischen Gegebenheiten und Entscheidungen Mutmaßungen über ihre Verläufe anstellen und ihre Abschätzungen in möglicherweise zukünftigen Verläufen des OECD-Indikators und der Abfallpreis-Zeitreihe in Zahlen fassen. Gibt es mehrere solcher plausiblen Szenarien, welche den Raum auch hinsichtlich pessimistischer sowie optimistischer Entwicklungen des OECD-Indikators und der Abfallpreise abdecken, so können wir ihre Auswirkungen auf die Rezyklatpreise analysieren und wir erhalten letztendlich mit Hilfe dieser Best-Case- und Worst-Case-Szenarien eine plausible Spanne für die zukünftigen Rezyklatpreise.
Wir haben in unserem Fallbeispiel statt auf Expertenschätzungen auf datenbasierte Szenarien zurückgegriffen: Aus den historischen Verläufen des OECD-Indikators und der Abfallpreiszeitreihe haben wir für diese beiden jeweils einen positiven sowie ein negativen Verlauf berechnet und basierend darauf mit Hilfe der Software Szenario-Forecasts erstellt. Wir sind uns dessen bewusst, dass solche Szenario-Forecasts natürlich stark von den getroffenen Annahmen abhängen. Dennoch bieten sie eine wertvolle Möglichkeit, ein Gefühl für die Sensitivität der Rezyklatpreise in Bezug auf die Einflussfaktoren zu bekommen und wichtiges Expertenwissen in die Vorhersagen zu integrieren.
Abbildung 5: Szenario-Forecasts für Rezyklatpreise für Mai 2024
Wir haben Prognosen für Rezyklatpreise für die nächsten Monate erzeugt und konnten entscheidende Einflussfaktoren integrieren, die den Verlauf ein Stück weit antizipieren können. Durch verschiedene mögliche, datenbasiert erzeugte Szenarien wurde die Zukunft des Rezyklatmarkts transparenter und Einkäufer können nun basierend auf den Ergebnissen informierte Kaufentscheidungen treffen.
Der Einbezug von Einflussfaktoren hat im Wesentlichen zwei Dinge bewirkt: 1. eine höhere Prognosegüte, die dazu führt, dass zukünftige Preise besser abschätzbar sind. Um auf das eingangs erwähnte Beispiel der Tankstelle zurückzukommen, heißt das, es wird bares Geld gespart, wenn man das Volltanken geschickt terminiert. Während die Summen bei Benzin noch vergleichsweise klein sind, können sie bei großen Mengen von benötigtem Kunststoff schnell riesig werden. Entsprechend hoch sind die Ersparnisse. 2. Die Erfahrung aus dem etablierten Markt und der dortigen jahrzehntelangen Erfahrung konnte durch passend einbezogene Einflussfaktoren und Prognosen in gewisser Weise auf den neuen Markt übertragen bzw. in quantifizierbare Ergebnisse überführt werden.
Wie so oft ist hier mehr nicht unbedingt besser: Wir haben zugunsten der Stabilität des Modells sogar auf einen Einflussfaktor verzichtet. Für die Erzeugung der Ergebnisse haben wir die Prognose-Software future verwendet. Sie kann die komplexen Anforderungen an eine Preisprognose erfüllen, die sowohl die Preishistorie sowie weitere Einflussfaktoren aus dem wirtschaftlichen Umfeld systematisch verarbeitet und daraus konkrete Zahlen für die Zukunft erstellt.
Es bleibt eine Unsicherheit im Prognosemodell, die wir durch Prognoseintervalle abgebildet haben. Um sie zu erklären und die Ergebnisse zu interpretieren, braucht es Fachexperten aus dem Rezyklatmarkt wie Peter Jetzer, dessen langjährige Expertise es ihm ermöglicht, beispielsweise einmalige Ereignisse in Bezug zum Rezyklatmarkt zu setzen, was ein datenbasiertes Modell nicht leisten kann. Nichtsdestotrotz ist durch unsere Preisprognosen der relativ neue Rezyklatmarkt ein deutliches Stück transparenter und damit vorausschauendes Agieren sowie ein informiertes Einkaufsverhalten möglich geworden.
1: OECD (2024), Business confidence index (BCI) (indicator). doi: 10.1787/3092dc4f-en (Accessed on 26 June 2024)
Sie möchten future am liebsten direkt einmal selbst testen?
Ihr Partner für Predictive Analytics und Data Science.
Weitere Angaben, u. a. zum Datenschutz, finden Sie in unserem Impressum und unserer Datenschutzerklärung.
© 2024 prognostica GmbH