Die Predictive Szenarios in der SAP Analytics Cloud lassen sich entweder auf einfachen Datensätzen (also durch die einmalige Bereitstellung von historischen Daten in einer „flachen Tabelle“) oder auf SAC-Planungsmodellen aufsetzen, in die auch die prognostizierten Werte zurückgeschrieben und durch einen Planungsanwender überschrieben werden können.
Hierfür sind jedoch separate Planungslizenzen erforderlich. Das reine Prognostizieren ist bereits mit der Standard BI User Lizenz möglich. Das Ergebnis ist in beiden Fällen inhaltlich identisch.
Die Faustregel für die Prognose: 5:1
Um den gewünschten Zeitraum prognostizieren zu können, ist es wichtig zu wissen, dass dieser von der Anzahl der historischen Daten abhängig ist. Die Faustregel ist 5:1. Mit fünf historischen Monaten kann ein künftiger Monat visualisiert werden. Mit 60 historischen Monaten lassen sich 12 zukünftige Monate erzeugen.
Die Modellgüte – MAPE
Die Qualität der prognostizierten Daten ist selbstverständlich abhängig von der Qualität der historischen Daten. Die Vorhersage kann sowohl auf einem Attribut innerhalb der Daten als auch auf der Kombination aus mehreren Attributen bestehen.
Der Forecast lässt sich rein auf zwei Marken (Attribut 1) erstellen oder wie am Beispiel hier auf einzelnen Sorten (Attribut 2). Je mehr Merkmale in den Daten zugrunde liegen, desto mehr Anhaltspunkte sind für die Prognose verfügbar. Je „ähnlicher“ der zeitliche Verlauf all dieser Anhaltspunkte ist, umso genauer ist die Prognose.
Diese Genauigkeit, beziehungsweise eigentlich der Fehleranteil, wird „MAPE“ (Mean Absolute Percentage Error = mittlerer absoluter prozentualer Fehler) genannt. Beispielsweise liegt die Fehlerwahrscheinlichkeit beim „Big Sandwich“ bei 24,83 Prozent. Im Gegensatz dazu ist die Fehlerwahrscheinlichkeit für das „Kaktus Eis“ lediglich bei 3,86 Prozent.
Realisierung eines Time Series Forecast in der Praxis
Die Erstellung eines Time Series Forecast in der Praxis ist relativ leicht. Da für die Nutzung von sogenannten „Datasets“ keine separate Lizenz notwendig ist, wird dieser Weg folgend aufgezeigt. Der elementare Teil ist wie immer die Vorbereitung. Es wird eine CSV- oder Excel-Datei benötigt, die mindestens die Spalten „Merkmal“, „Zeit“ und „Wert“ enthält.
Die Zeit kann dabei beliebig auf Jahres-, Monats- oder auch auf Wochen- und Tagesbasis vorliegen. Das Merkmal ist das Unterscheidungskriterium für den Forecast, im oben genannten Beispiel sind es zwei (der Hersteller und die Eissorte).
Ein Dataset kann jedoch beliebig viele Merkmale enthalten. Erst innerhalb des Smart Predict wird festgelegt, welche davon in die Prognose einfließen sollen. Zuletzt wird noch der jeweilige historische Wert je Zeitmerkmal benötigt, beispielsweise die Verkaufszahl pro Monat. Dies kann eine Menge, ein Preis, ein Wert oder eine Kennzahl ohne Einheit sein.
Es ist nur wichtig, dass diese Spalte im Dataset als Kennzahl definiert ist. Im Anschluss kann das Prognoseszenario aufgebaut werden.
Links in der Abbildung sind die Definitionen innerhalb des Prognoseszenarios dargestellt. Der Typ der Prognose (Zeitreihe) ist erkennbar und als Datenquelle ist das Dataset hinterlegt.
Bei einem Planungsmodell als Datenquelle müsste die jeweilige „Version“ ausgewählt werden, auf der prognostiziert wird. Die verwendete Kennzahl wird über das „Ziel“ definiert. Das „Datum“ ist das im Dataset festgelegte Zeitmerkmal. Auch die Anzahl der Prognosezeiträume kann gesetzt werden (wichtig ist, die 5:1-Regel zu beachten).
Im letzten Schritt ist festzulegen, welche sogenannten „Entitäten“ (also die Spalten im Dataset) in der Prognose berücksichtigt werden sollen. In diesem Fall ist es die Kombination aus Hersteller und Eissorte.
Je nachdem, wie viele Ausprägungen die jeweiligen Entitäten aufweisen, gibt es eine unterschiedliche Anzahl aus einzelnen Prognosen.
Beispiel
Mit dem Attribut „Hersteller“ (hier zwei) werden nur die Verkäufe der einzelnen Eissorten summiert und am Ende lediglich zwei Entitäten prognostiziert. Bei insgesamt 20 Eissorten (zehn pro Hersteller) zeigt das Ergebnis je eine Verkaufszahl in Stück, pro Zeitmerkmal und Eissorte.
Die Hersteller sind nur zur leichteren Unterscheidung enthalten. Existiert zwischen den zwei Entitäten jedoch keine 1:n-, sondern eine n:m-Beziehung, so wird die Anzahl der Prognosen pro Zeit auch n*m sein, sofern jede Kombination in den Daten vorkommt.
Das heißt, die Prognose basiert rein auf historischen Kombinationen. Das Szenario erzeugt im Forecast selbstverständlich keine neuen Kombinationen, die es in der Vergangenheit nicht gab.
Die Darstellung des Prognose-Ergebnisses erfolgt im Szenario auf drei Reitern:
1. Übersicht
Hier werden die obersten und untersten Entitäten anhand des erwarteten MAPE dargestellt. Also diejenigen mit der besten und der schlechtesten Vorhersage. Außerdem wird der durchschnittliche MAPE über alle Prognosen gezeigt.
2. Prognose
Auf dieser Seite lassen sich die Entitäten via Drop-down-Box durchschalten und die prognostizierten Werte anhand einer Zeitreihen-Grafik auswerten. Die Linien stellen hierbei das historische Ist, die jeweilige Prognose, die Ausreißer sowie ein Fehlermaximum und -minimum dar.
3. Erläuterung
Diese Seite enthält die gleichen Drop-down-Boxen zur detaillierteren Analyse. Die Zeitreihe wird hier beispielsweise um Trends, Zyklen, Einflussfaktoren und Schwankungen ergänzt, die zudem auch beschrieben und erläutert werden.
Fazit
Die SAP Analytics Cloud ist nicht nur ein umfangreiches Analyse-, Planungs- und Reporting-Werkzeug, sondern glänzt auch mit Fähigkeiten in der künstlichen Intelligenz. In verschiedenen Prognose-Szenarien lassen sich diese intuitiv und leicht einsetzen.