Sunday 30 April 2017

Moving Average To Remove Saisonalität


Spreadsheet-Implementierung der saisonalen Anpassung und exponentieller Glättung Es ist einfach, saisonale Anpassung durchzuführen und exponentielle Glättungsmodelle mit Excel anzupassen. Die unten aufgeführten Bildschirmbilder und Diagramme werden einer Tabellenkalkulation entnommen, die eine multiplikative saisonale Anpassung und eine lineare Exponentialglättung auf den folgenden vierteljährlichen Verkaufsdaten von Outboard Marine darstellt: Um eine Kopie der Tabellenkalkulation selbst zu erhalten, klicken Sie hier. Die Version der linearen exponentiellen Glättung, die hier für Demonstrationszwecke verwendet wird, ist die Brown8217s-Version, nur weil sie mit einer einzigen Spalte von Formeln implementiert werden kann und es nur eine Glättungskonstante gibt, die optimiert werden soll. In der Regel ist es besser, Holt8217s Version verwenden, die separate Glättungskonstanten für Ebene und Trend hat. Der Prognoseprozess verläuft wie folgt: (i) Die Daten werden saisonbereinigt (ii) sodann für die saisonbereinigten Daten über lineare exponentielle Glättung Prognosen erstellt und (iii) schließlich werden die saisonbereinigten Prognosen zur Erzielung von Prognosen für die ursprüngliche Serie herangezogen . Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der Saisonbereinigung besteht darin, einen zentrierten gleitenden Durchschnitt (hier in Spalte D) zu berechnen. Dies kann erreicht werden, indem der Durchschnitt von zwei einjährigen Durchschnittswerten, die um eine Periode relativ zueinander versetzt sind, genommen wird. (Eine Kombination von zwei Offset-Durchschnittswerten anstatt eines einzigen Mittels wird für die Zentrierung benötigt, wenn die Anzahl der Jahreszeiten gleich ist.) Der nächste Schritt besteht darin, das Verhältnis zum gleitenden Durchschnitt zu berechnen. Wobei die ursprünglichen Daten durch den gleitenden Durchschnitt in jeder Periode dividiert werden, was hier in Spalte E durchgeführt wird. (Dies wird auch Quottrend-Cyclequot-Komponente des Musters genannt, sofern Trend - und Konjunktur-Effekte als all dies betrachtet werden können Bleibt nach einer Durchschnittsberechnung über ein ganzes Jahr im Wert von Daten bestehen. Natürlich können die monatlichen Veränderungen, die nicht saisonal bedingt sind, durch viele andere Faktoren bestimmt werden, aber der 12-Monatsdurchschnitt glättet sie weitgehend Wird der geschätzte saisonale Index für jede Jahreszeit berechnet, indem zuerst alle Verhältnisse für die jeweilige Jahreszeit gemittelt werden, was in den Zellen G3-G6 unter Verwendung einer AVERAGEIF-Formel erfolgt. Die Durchschnittsverhältnisse werden dann neu skaliert, so dass sie auf das genau 100-fache der Anzahl der Perioden in einer Jahreszeit, oder 400 in diesem Fall, das in den Zellen H3-H6 erfolgt, summieren. Unten in der Spalte F werden VLOOKUP-Formeln verwendet, um den entsprechenden saisonalen Indexwert in jede Zeile der Datentabelle einzufügen, entsprechend dem Viertel des Jahres, das es repräsentiert. Der zentrierte gleitende Durchschnitt und die saisonbereinigten Daten enden wie folgt: Beachten Sie, dass der gleitende Durchschnitt typischerweise wie eine glattere Version der saisonbereinigten Serie aussieht und an beiden Enden kürzer ist. Ein weiteres Arbeitsblatt in derselben Excel-Datei zeigt die Anwendung des linearen exponentiellen Glättungsmodells auf die saisonbereinigten Daten beginnend in Spalte G. Über der Prognosespalte (hier in Zelle H9) wird ein Wert für die Glättungskonstante (alpha) eingetragen Zur Vereinfachung wird ihm der Bereichsname quotAlpha. quot zugewiesen (Der Name wird mit dem Befehl quotInsertNameCreatequot zugewiesen.) Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich dem ersten Istwert der saisonbereinigten Serie gesetzt werden. Die hier verwendete Formel für die LES-Prognose ist die rekursive Einzelformel des Brown8217s-Modells: Diese Formel wird in der Zelle entsprechend der dritten Periode (hier Zelle H15) eingegeben und von dort nach unten kopiert. Beachten Sie, dass sich die LES-Prognose für die aktuelle Periode auf die beiden vorherigen Beobachtungen und die beiden vorhergehenden Prognosefehler sowie auf den Wert von alpha bezieht. Somit bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. (Natürlich könnten wir statt der linearen exponentiellen Glättung einfach statt der linearen exponentiellen Glättung verwenden, könnten wir stattdessen die SES-Formel ersetzen. Wir könnten auch Holt8217s anstelle von Brown8217s LES-Modell verwenden, was zwei weitere Spalten von Formeln erfordern würde, um das Niveau und den Trend zu berechnen Die in der Prognose verwendet werden.) Die Fehler werden in der nächsten Spalte (hier Spalte J) durch Subtrahieren der Prognosen von den Istwerten berechnet. Der Quadratwurzel-Quadratfehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittelwerts berechnet. (Dies ergibt sich aus der mathematischen Identität: MSE VARIANCE (Fehler) (AVERAGE (Fehler)). 2) Bei der Berechnung des Mittelwertes und der Varianz der Fehler in dieser Formel sind die ersten beiden Perioden ausgeschlossen, da das Modell nicht tatsächlich mit der Prognose beginnt Die dritte Periode (Zeile 15 auf der Kalkulationstabelle). Der optimale Wert von alpha kann entweder durch manuelles Ändern von alpha gefunden werden, bis das minimale RMSE gefunden wird, oder Sie können das quotSolverquot verwenden, um eine genaue Minimierung durchzuführen. Der Wert von alpha, den der Solver gefunden hat, wird hier angezeigt (alpha0.471). Es ist in der Regel eine gute Idee, die Fehler des Modells (in transformierten Einheiten) zu zeichnen und ihre Autokorrelationen zu berechnen und zu zeichnen, bis zu einer Saison. Hier ist eine Zeitreihenfolge der (saisonbereinigten) Fehler: Die Fehlerautokorrelationen werden mit Hilfe der CORREL () - Funktion berechnet, um die Korrelationen der Fehler selbst mit einer oder mehreren Perioden zu berechnen - Einzelheiten sind im Kalkulationsblatt dargestellt . Hier ist ein Diagramm der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen: Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind sehr nahe bei Null, aber die Spitze bei Verzögerung 4 (deren Wert 0,35 ist) ist etwas mühsam Saisonale Anpassungsprozess nicht vollständig erfolgreich war. Allerdings ist es eigentlich nur marginal signifikant. 95 Signifikanzbanden zum Testen, ob Autokorrelationen signifikant von Null verschieden sind, sind ungefähr plus-oder-minus 2SQRT (n-k), wobei n die Stichprobengröße und k die Verzögerung ist. Hier ist n gleich 38 und k variiert von 1 bis 5, so daß die Quadratwurzel von - n-minus-k für alle von etwa 6 ist, und daher sind die Grenzen für das Testen der statistischen Signifikanz von Abweichungen von Null grob plus - Oder-minus 26 oder 0,33. Wenn Sie den Wert von alpha von Hand in diesem Excel-Modell variieren, können Sie den Effekt auf die Zeitreihen und Autokorrelationsdiagramme der Fehler sowie auf den Root-mean-squared-Fehler beobachten, der nachfolgend erläutert wird. Am Ende der Kalkulationstabelle wird die Prognoseformel quasi in die Zukunft gestartet, indem lediglich Prognosen für tatsächliche Werte an dem Punkt ausgetauscht werden, an dem die tatsächlichen Daten ablaufen - d. h. Wo die Zukunft beginnt. (Mit anderen Worten, in jeder Zelle, in der ein zukünftiger Datenwert auftreten würde, wird eine Zellreferenz eingefügt, die auf die Prognose für diese Periode hinweist.) Alle anderen Formeln werden einfach von oben nach unten kopiert: Beachten Sie, dass die Fehler für die Prognosen von Die Zukunft werden alle berechnet, um Null zu sein. Dies bedeutet nicht, dass die tatsächlichen Fehler null sein werden, sondern lediglich die Tatsache, dass wir für die Vorhersage davon ausgehen, dass die zukünftigen Daten den Prognosen im Durchschnitt entsprechen werden. Die daraus resultierenden LES-Prognosen für die saisonbereinigten Daten sehen wie folgt aus: Mit diesem für α-Periodenprognosen optimalen Wert von alpha ist der prognostizierte Trend leicht nach oben, was auf den lokalen Trend in den letzten 2 Jahren zurückzuführen ist oder so. Für andere Werte von alpha könnte eine sehr unterschiedliche Trendprojektion erhalten werden. Es ist normalerweise eine gute Idee, zu sehen, was mit der langfristigen Trendprojektion geschieht, wenn Alpha variiert wird, weil der Wert, der für kurzfristige Prognosen am besten ist, nicht notwendigerweise der beste Wert für die Vorhersage der weiter entfernten Zukunft sein wird. Dies ist beispielsweise das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0,25 gesetzt wird: Der projizierte Langzeittrend ist jetzt eher negativ als positiv Mit einem kleineren Wert von alpha setzt das Modell mehr Gewicht auf ältere Daten Seine Einschätzung des aktuellen Niveaus und Tendenz und seine langfristigen Prognosen spiegeln den in den letzten 5 Jahren beobachteten Abwärtstrend anstatt den jüngsten Aufwärtstrend wider. Dieses Diagramm zeigt auch deutlich, wie das Modell mit einem kleineren Wert von alpha langsamer ist, um auf quotturning pointsquot in den Daten zu antworten und daher tendiert, einen Fehler des gleichen Vorzeichens für viele Perioden in einer Reihe zu machen. Die Prognosefehler von 1-Schritt-Vorhersage sind im Mittel größer als die, die zuvor erhalten wurden (RMSE von 34,4 statt 27,4) und stark positiv autokorreliert. Die Lag-1-Autokorrelation von 0,56 übersteigt den oben berechneten Wert von 0,33 für eine statistisch signifikante Abweichung von Null deutlich. Als Alternative zum Abkürzen des Wertes von Alpha, um mehr Konservatismus in Langzeitprognosen einzuführen, wird manchmal ein Quottrend-Dämpfungsquotfaktor dem Modell hinzugefügt, um die projizierte Tendenz nach einigen Perioden abflachen zu lassen. Der letzte Schritt beim Erstellen des Prognosemodells besteht darin, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu veranschaulichen. Somit sind die reseasonalisierten Prognosen in Spalte I einfach das Produkt der saisonalen Indizes in Spalte F und der saisonbereinigten LES-Prognosen in Spalte H. Es ist relativ einfach, Konfidenzintervalle für einstufige Prognosen dieses Modells zu berechnen: Erstens Berechnen Sie den RMSE (root-mean-squared Fehler, der nur die Quadratwurzel des MSE ist) und berechnen Sie dann ein Konfidenzintervall für die saisonbereinigte Prognose durch Addition und Subtraktion zweimal des RMSE. (Im Allgemeinen ist ein 95-Konfidenzintervall für eine Ein-Perioden-Vorausprognose ungefähr gleich der Punktvorhersage plus-oder-minus-zweimal der geschätzten Standardabweichung der Prognosefehler, vorausgesetzt, die Fehlerverteilung ist annähernd normal und die Stichprobengröße Ist groß genug, sagen wir, 20 oder mehr Hier ist die RMSE anstelle der Standardabweichung der Fehler die beste Schätzung der Standardabweichung der zukünftigen Prognosefehler, weil sie auch die Zufallsvariationen berücksichtigt.) Die Vertrauensgrenzen Für die saisonbereinigte Prognose werden dann reseasonalisiert. Zusammen mit der Prognose, durch Multiplikation mit den entsprechenden saisonalen Indizes. In diesem Fall ist die RMSE gleich 27,4 und die saisonbereinigte Prognose für die erste künftige Periode (Dez-93) beträgt 273,2. So dass das saisonbereinigte 95-Konfidenzintervall von 273,2-227,4 218,4 auf 273,2227,4 328,0 liegt. Das Multiplizieren dieser Limits durch Decembers saisonalen Index von 68,61. Erhalten wir niedrigere und obere Konfidenzgrenzen von 149,8 und 225,0 um die Dez-93-Punktprognose von 187,4. Die Vertrauensgrenzen für Prognosen, die länger als eine Periode vorangehen, werden sich in der Regel aufgrund der Unsicherheit über das Niveau und die Tendenz sowie die saisonalen Faktoren erweitern, da der Prognosehorizont zunimmt, aber es ist schwierig, diese im allgemeinen durch analytische Methoden zu berechnen. (Die geeignete Methode zur Berechnung der Vertrauensgrenzen für die LES-Prognose ist die Verwendung der ARIMA-Theorie, aber auch die Unsicherheit in den saisonalen Indizes ist eine andere.) Wenn Sie ein realistisches Konfidenzintervall für eine Prognose über mehrere Perioden bevorzugen, Fehler zu berücksichtigen, ist Ihre beste Wette, empirische Methoden zu verwenden: Zum Beispiel, um ein Vertrauensintervall für eine 2-Schritt-Vorausprognose zu erhalten, könnten Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-Voraus-Prognose für jeden Zeitraum zu berechnen Durch Booten der Ein-Schritt-Voraus-Prognose). Dann berechnen Sie die RMSE der 2-Schritt-Voraus-Prognose Fehler und verwenden Sie diese als Grundlage für ein 2-Schritt-Ahead-Konfidenzintervall.8216Tis Die Saisonalität Ihrer Metriken Ein paar Beiträge zurück, untersuchte ich eine einfache Technik für die Verwendung eines exponentiellen bewegen (EMA) auf Ihre Zeitreihenmetriken. Dies hat den Vorteil der Glättung der Metriken bei gleichzeitiger Beibehaltung einer 8220memory8221 aller vorherigen Werte der Metrik, die vorher kam. Es hat auch den Vorteil, dass es leichter aktualisiert werden kann, wenn neue Werte für Ihre Metriken verfügbar werden. Dieses Mal möchte ich Ihnen zeigen, eine Technik, um eine andere gemeinsame Zeitreihe Problem zu beheben: Saisonalität. Yeah, Ihre Metriken sind im Januar, aber ist, dass die üblichen Post-Urlaub Umsatz Einbruch oder ist es der Beginn eines wahren Abwärtstrend, die Sie brauchen, um ein Auge auf den Artikel zu veranschaulichen eine schnelle und einfache Art und Weise zu de-Saisonalisierung Ihrer Daten. Let8217s Arbeit durch ein Beispiel Schritt für Schritt: Stellen Sie sich vor, wir arbeiten bei einem Software-Unternehmen, wo das Unternehmensebene Produkt hat eine ziemlich lange Verkaufszyklus, und unsere Metrik ist tatsächlich Rohumwandlungen während eines Quartals. Wenn Sie sich auf Ihre Umsatz-Umsatz-Metriken in der oben genannten Chart, wie geht es Ihnen in letzter Zeit Besser als 2010 So gut wie 2011 Here8217s die Rohdaten: Schritt 1: Sammeln Sie Metriken Data Go Back Mindestens 3 Full-Cycle-Perioden Für die meisten Leute, Das bedeutet vierteljährliche oder monatliche Daten, die drei Jahre zurückliegen. Ja, Sie können wöchentliche oder tägliche Daten verwenden, obwohl you8217ll normalerweise wollen, um diese Daten zu glätten (cha-ching eine weitere große Verwendung für den exponentiellen gleitenden Durchschnitt). Und es needn8217t im Laufe eines ganzen Jahres sein, wenn die 8220seasons8221 Ihre Daten durch isn8217t gemessen durch die Kalendermonate 8212 so, wenn you8217re Blick auf Tag-der-Woche Daten, sagen wir, zu vergleichen, wie Ihre Kunden am Montag zu handeln Versus Donnerstag, dann eine gute 8-12 Wochen Daten wäre ein kluges Minimum. Schritt 2: Vergleiche Time-Periods wie Time-Periods Zum Beispiel, betrachten Sie alle Januar oder alle dienstags, und berechnen Sie einen Durchschnitt. Hier verwende ich ein einfaches Mittel statt der EMA. Da die EMA so konzipiert ist, dass sie für die Zeitreihenperiode verwendbar ist, die sequentiell verglichen wird 8212, die einen Februar mit dem Januar verglichen hat, der vor ihm 8212 kam, und wir dies nicht eher tun, können wir die Daten als reine Daten behandeln und unser Endziel ist es Extrahieren die saisonalen Zeitreihen. Schritt 3: Normalisierung Vergleichen Sie alle diese Mittelwerte miteinander und teilen Sie jeden der Mittelwerte mit dem Mittelwert der Durchschnittswerte auf, was im Vergleich zu dem Normalwert, der als 8220normalization bezeichnet wird, im Durchschnitt einen saisonbereinigten Faktor ergibt Ist, wie wir vergleichen 8220apples zu apples8221 über mehrere Jahre und im Zusammenhang mit der gesamten Saison Wirkung. Schritt 4: Dividieren Sie jeden ursprünglichen Datenpunkt durch seinen saisonbereinigten Faktor Dies gibt Ihnen einen effektiven Wert für diese Metrik mit der saisonalen Komponente entfernt. Schritt 5: Auslosung der Schlussfolgerungen Betrachten Sie diese neuen de-saisonalisierten Daten und ziehen Sie Schlussfolgerungen, falls vorhanden, aus. Nun, da wir die Saisonalität der Verkäufe subtrahiert haben, sind Ihre Schlussfolgerungen unterschiedlich Angesichts der roten, de-seasoned Daten, sieht es sicher aus wie die 2012 niedrig ist sogar niedriger als das Ende des Jahres 2010, und die 2012 isn8217t fast so hoch wie Im Jahr 2011. Dies sollte dazu führen, dass einige Bestürzung in der nächsten Verkaufstreffen Natürlich gibt es eine zillion Vorbehalte hier. Ist Ihre Daten auch saisonale an erster Stelle Blick auf die blaue Linie, das Beste, was wir sagen können, ist 8220maybe8221 8212 it8217d toll, mehr Daten zu haben. Vielleicht eine monatliche Aufschlüsselung der Daten anstelle von vierteljährlich. Ein weiterer Vorbehalt könnte zyklisch sein 8212, wenn der Konjunkturzyklus Ihren Verkaufszyklus dominiert, dann kann es leicht die saisonale Komponente 8212 schwellen, aber wenn that8217s der Fall, warum die niedrigere niedrig im 2012 Verkäufe So, meine Frage in diesem Monat: wenn Sie Ihre Metriken betrachten , Erklären Sie Saisonalität Oder schauen Sie gerade, um zu sehen, wenn die Zahlen 8220up8221 im letzten Report sind Sie konnten eine Schlüsseleinsicht vermissen. Einige Meinungen in diesem Artikel können die eines Gast-Autor und nicht unbedingt Marketing Land sein. Hier sind die Autoren der Autoren aufgelistet. Über den Autor John Quarto-vonTivadar ist einer der Erfinder der Persuasion Architektur und regelmäßig bekämpft Innumeracy unter den Vermarktern in seinem beliebten Math for Marketers Serie. Johns 2008 Bestseller, Always Be Testing, geschrieben mit Geschäftspartner Bryan Eisenberg, wurde die Standard-Referenz für die Umwandlung Optimierung durch Testen seit seiner Veröffentlichung und wurde für die Grundlage der beiden akademischen Kursarbeit sowie Corporate Training verwendet. Related TopicsRemoving Daily Seasonality Während ich in der Regel anfangen, auf Web-Analytics-Daten auf einer wöchentlichen oder monatlichen Ebene zu suchen, gibt es Zeiten, wenn es sinnvoll ist, bohren Sie bis zu täglichen Zahlen. Dies kann bei der Prüfung der Grund für eine Änderung der Daten oder einfach auf die vorherige day8217s Leistung zu überprüfen. Aber es kommt zu einem Problem, das es schwierig macht, aus diesen Tagesdaten nützliche Erkenntnisse zu interpretieren und zu extrahieren. Die meisten Metriken, wenn sie auf Tageshöhe betrachtet werden, enthalten eine Form der täglichen Saisonalität. Dies ist am deutlichsten in Metriken wie Besuche, Seitenansichten oder Verkäufe, die absolute Zahlen sind. Es gibt ein Wiederauftreten Muster während der Woche mit Gipfeln und Tröge an den gleichen Tagen pro Woche. Ein Beispiel für dieses Muster ist in Abbildung 1 unten zu sehen. Während dies macht jedes Diagramm ziemlich zu betrachten, macht es schwierig, Trends oder Spikes in den Daten wirklich identifizieren. Ist ein Datenpunkt hoch, weil es eine Spitze oder weil es ein Montag war Es ist Schulferien, aber sollte die Anzahl der Besuche auf dem Sat wirklich so niedrig sein Und selbstverständlich, an welchem ​​Tag fingen wir an, Verkehr zu sehen, von und wie viel zu sehen Einer Veränderung ist es wirklich Eine gängige Methode, um die saisonale Saison zu entfernen ist, um die Linie mit einem gleitenden Durchschnitt zu glätten. Da es ein wöchentliches Muster ist, sollte ein Siebenpunkt gleitender Durchschnitt zu einer schönen glatten Linie führen. Leider, wie in Abbildung 2 zu sehen ist, bedeutet dies, dass Sie eine schöne, glatte Linie, versteckt die meisten dieser interessanten Spikes und Schrittänderungen und allgemeine Daten-Trends. Sie können allgemeine Trends sehen, aber Sie können bestimmte Tage nicht ermitteln, wenn eine Änderung eingetreten ist. Es ist auch schwierig, eine Änderung sofort klar zu identifizieren, da jeder Tag nur einen siebten zu jedem Datenpunkt beiträgt. Was ich empfehlen, stattdessen ist es, die tägliche Saisonalität von jedem Datenpunkt zu entfernen, was zu einer Zeile, die von dem Tag der Woche nicht betroffen ist. Mit dieser Methode bedeutet, dass es klar ist, um zu sehen, ob die Leistung jeden Tag war gut oder schlecht. Zum Beispiel ist in Figur 3 ersichtlich, daß der relativ schlimmste Tag für Besuche tatsächlich der 25. August war, obwohl Besuche für diesen Tag höher waren als für andere Tage während der gemeldeten Periode. Die Technik zur Entfernung der täglichen Saisonalität kann jeden Tag angewendet werden, so dass Sie sofort eine Leistungsänderung erkennen und darauf reagieren können. Die Schwierigkeit besteht dann darin, die tägliche Saisonalität über eine Woche zu berechnen. Dies kann getan werden richtig mit SPSS oder ein ähnliches Werkzeug, aber ich benutze eine schnelle Hack-Workaround in Excel, dass, während nicht 100 genau, bekommt den Job zu erledigen. Die Schritte zur Berechnung der täglichen Saisonalität für eine Metrik (unter Verwendung der Beispiele für Besuche) sind wie folgt, wobei das Beispiel in Abbildung 4 dargestellt ist: Auszug historischer täglicher Besuchsdaten. Sie benötigen mindestens 6 Wochen, mehr, wenn der Zeitraum eine bekannte Anzahl von Faktoren enthält, die sich auf den Verkehr auswirken könnten, z. B. Schulferien, Feiertage, Produkt-Releases, Marketing-Kampagnen, etc. Ordnen Sie die Daten so, dass jede Spalte enthält eine einzelne Woche und jede Zeile enthält nur Daten für einen bestimmten Tag der Woche. Erstellen Sie diese Tabelle so, aber ersetzen Sie die Besuche für jeden Tag mit dem, dass Besuche für diesen Tag beigetragen, um insgesamt Besuche für diese Woche. Fügen Sie zwei weitere Spalten hinzu, um den Mittelwert und den Mittelwert für jede Datenzeile zu berechnen. Löschen Sie alle Wochen, die Tage enthalten, die das allgemeine Muster widerspiegeln. In diesem Beispiel wurden die Wochen 5 und 6 gelöscht. An diesem Punkt sollten Mittelwert und Median für jeden Wochentag relativ ähnlich sein. Die tägliche Saisonalität wird durch Multiplikation der täglichen Mittel mit 7 erreicht. Dieses tägliche Saisonalitätsmuster kann dann verwendet werden, um die tägliche Saisonalität für diese Metrik für jeden Tag zu entfernen. Teilen Sie einfach den Wert für jeden Tag durch die jeweilige tägliche Saisonalität, um sie zu entfernen. Ich in der Regel dies mit einem vlookup gegen den Tag der Woche für jedes Datum. Zurück zum Grund für Web-Analytics, können Sie diese Technik verwenden, um Daten zu säubern, so dass Sie sofort erkennen können gute und schlechte Tage, sei es historische Daten oder nur für den vorhergehenden Tag. Wenn Sie diese für historische Daten verwenden, können Sie die interessanten Tage identifizieren, um weiter zu untersuchen (Spiel mit durch Segmentierung). Wenn Sie auf einer laufenden Basis verwenden, können Sie sofort sehen, welche Leistung war wie für den Vortag und wenn nötig, zu untersuchen und reagieren auf eine Änderung entsprechend. Zurzeit, um diese Art der Analyse durchführen zu können, müssen Sie die Daten in Excel extrahieren. Hoffentlich eines Tages, können Web-Analytics-Tools können Sie eine tägliche Saisonalität Muster für eine Metrik, so dass Sie die täglichen Daten mit dieser Saisonalität entfernt angezeigt werden können. Und mein Traum ist von einem Werkzeug, das die Fähigkeit, automatisch das Muster für jede ausgewählte Metrik (mit Handbuch über Fahrten für Tweaking natürlich). Die andere wichtige Verwendung, die ich für eine tägliche Saisonalität Muster gefunden haben, ist es in der Prognose täglich Verkehr verwendet werden kann. Wenn Sie in der Lage sind zu prognostizieren, was die week8217s Verkehr sollte, kann dies leicht mit dem täglichen Saisonalität Muster zur Prognose Verkehr auf einer täglichen Ebene multipliziert werden. Eine Kopie der Excel-Datei, die alle in den obigen Beispielen verwendeten Daten, Diagramme und Formeln enthält, können hier heruntergeladen werden 8211 Daily Seasonality File. Dieser Beitrag wurde ursprünglich veröffentlicht auf AussieWebAnalys t am 26. November 821708

No comments:

Post a Comment