Preisanalyse

Methoden der Zeitreihenanalyse

Moderator: schubbiaschwilli

Antworten
Fledermaus
Beiträge: 25
Registriert: Di Aug 04, 2020 3:00 pm

Preisanalyse

Beitrag von Fledermaus »

Hallo zusammen,

ich würde gerne den nachfolgenden Datensatz untersuchen.
Der Datensatz enthält die Preise von zwei Anbietern über 6 verschiedene Produkte im Zeitablauf von 2010 bis 2019.

Code: Alles auswählen

   Produkte Anbieter X2010 X2011 X2012 X2013 X2014 X2015 X2016 X2017 X2018 X2019
1          1        1  2.27  2.36  2.40  2.58  2.66  2.49  2.79  2.70  2.83  2.83
2          1        2  1.99  2.04  1.90  2.02  2.04  2.04  1.95  2.17  2.04  2.25
3          2        1  2.16  2.63  2.43  3.07  2.79  3.27  3.37  3.58  3.05  3.24
4          2        2  1.86  1.83  1.72  1.80  1.76  1.71  2.03  1.98  2.06  1.67
5          3        1  2.19  2.21  2.30  2.30  2.44  2.49  2.72  2.51  2.70  2.85
6          3        2  1.75  1.79  1.79  1.87  1.79  1.93  1.99  1.92  2.07  2.00
7          4        1  1.73  1.73  1.75  1.88  1.91  2.28  2.01  2.01  1.93  2.02
8          4        2  1.48  1.40  1.47  1.45  1.45  1.48  1.63  1.59  1.54  1.50
9          5        1  2.40  2.02  2.12  2.21  2.25  2.20  2.88  2.23  2.59  2.68
10         5        2  1.51  1.71  1.64  1.76  1.78  1.74  1.79  1.77  1.92  1.82
11         6        1  2.19  2.36  2.32  2.37  2.22  2.55  2.57  2.53  2.58  2.72
12         6        2  2.01  1.94  1.86  2.07  2.01  2.00  2.29  2.12  2.09  2.09
Nun würde ich gerne feststellen in welchen Kategorien die Anbieter sich hinsichtlich der Preisanpassung im Zeitablauf unterscheiden und in welchen Kategorien sich die Anbieter nicht unterscheiden.

Weiß jemand wie man das untersuchen kann?

Um euch einen besseren Überblick zu verschaffen habe ich den Datensatz oben in das "weite" Format gepackt, unten findet ihr noch einmal das "lange" Format.

Code: Alles auswählen

  Produkte Anbieter Preise Jahre
1          1        1   2.27  2010
2          1        1   2.36  2011
3          1        1   2.40  2012
4          1        1   2.58  2013
5          1        1   2.66  2014
6          1        1   2.49  2015
7          1        1   2.79  2016
8          1        1   2.70  2017
9          1        1   2.83  2018
10         1        1   2.83  2019
11         1        2   1.99  2010
12         1        2   2.04  2011
13         1        2   1.90  2012
14         1        2   2.02  2013
15         1        2   2.04  2014
16         1        2   2.04  2015
17         1        2   1.95  2016
18         1        2   2.17  2017
19         1        2   2.04  2018
20         1        2   2.25  2019
21         2        1   2.16  2010
22         2        1   2.63  2011
23         2        1   2.43  2012
24         2        1   3.07  2013
25         2        1   2.79  2014
26         2        1   3.27  2015
27         2        1   3.37  2016
28         2        1   3.58  2017
29         2        1   3.05  2018
30         2        1   3.24  2019
31         2        2   1.86  2010
32         2        2   1.83  2011
33         2        2   1.72  2012
34         2        2   1.80  2013
35         2        2   1.76  2014
36         2        2   1.71  2015
37         2        2   2.03  2016
38         2        2   1.98  2017
39         2        2   2.06  2018
40         2        2   1.67  2019
41         3        1   2.19  2010
42         3        1   2.21  2011
43         3        1   2.30  2012
44         3        1   2.30  2013
45         3        1   2.44  2014
46         3        1   2.49  2015
47         3        1   2.72  2016
48         3        1   2.51  2017
49         3        1   2.70  2018
50         3        1   2.85  2019
51         3        2   1.75  2010
52         3        2   1.79  2011
53         3        2   1.79  2012
54         3        2   1.87  2013
55         3        2   1.79  2014
56         3        2   1.93  2015
57         3        2   1.99  2016
58         3        2   1.92  2017
59         3        2   2.07  2018
60         3        2   2.00  2019
61         4        1   1.73  2010
62         4        1   1.73  2011
63         4        1   1.75  2012
64         4        1   1.88  2013
65         4        1   1.91  2014
66         4        1   2.28  2015
67         4        1   2.01  2016
68         4        1   2.01  2017
69         4        1   1.93  2018
70         4        1   2.02  2019
71         4        2   1.48  2010
72         4        2   1.40  2011
73         4        2   1.47  2012
74         4        2   1.45  2013
75         4        2   1.45  2014
76         4        2   1.48  2015
77         4        2   1.63  2016
78         4        2   1.59  2017
79         4        2   1.54  2018
80         4        2   1.50  2019
81         5        1   2.40  2010
82         5        1   2.02  2011
83         5        1   2.12  2012
84         5        1   2.21  2013
85         5        1   2.25  2014
86         5        1   2.20  2015
87         5        1   2.88  2016
88         5        1   2.23  2017
89         5        1   2.59  2018
90         5        1   2.68  2019
91         5        2   1.51  2010
92         5        2   1.71  2011
93         5        2   1.64  2012
94         5        2   1.76  2013
95         5        2   1.78  2014
96         5        2   1.74  2015
97         5        2   1.79  2016
98         5        2   1.77  2017
99         5        2   1.92  2018
100        5        2   1.82  2019
101        6        1   2.19  2010
102        6        1   2.36  2011
103        6        1   2.32  2012
104        6        1   2.37  2013
105        6        1   2.22  2014
106        6        1   2.55  2015
107        6        1   2.57  2016
108        6        1   2.53  2017
109        6        1   2.58  2018
110        6        1   2.72  2019
111        6        2   2.01  2010
112        6        2   1.94  2011
113        6        2   1.86  2012
114        6        2   2.07  2013
115        6        2   2.01  2014
116        6        2   2.00  2015
117        6        2   2.29  2016
118        6        2   2.12  2017
119        6        2   2.09  2018
120        6        2   2.09  2019
Vielen Dank und liebe Grüße
Tobi
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Preisanalyse

Beitrag von bigben »

Hallo Tobi,
Fledermaus hat geschrieben: Mi Aug 26, 2020 7:30 pmWeiß jemand wie man das untersuchen kann?
Solange das so unpräzise formuliert ist, am besten visuell:
Rplot03.jpeg
Es gibt keine zwei identischen Kurven also unterscheiden sie sich in allen Kategorien.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Fledermaus
Beiträge: 25
Registriert: Di Aug 04, 2020 3:00 pm

Re: Preisanalyse

Beitrag von Fledermaus »

Hallo Bernhard,

ich hätte mich klarer ausdrücken können, da hast du Recht.
Ich würde gerne untersuchen ob die Preisdifferenzen zwischen Anbieter 1 und Anbieter 2 sich im Zeitverlauf erhöhen/reduzieren oder konstant bleiben.

Ich habe die Tabelle dementsprechend modifiziert und die Preisdifferenzen für die einzelnen Produktkategorien im Zeitverlauf eingefügt.

Code: Alles auswählen

  Produkte X2010 X2011 X2012 X2013 X2014 X2015 X2016 X2017 X2018 X2019
1        1  0.28  0.32  0.50  0.57  0.63  0.45  0.84  0.53  0.78  0.58
2        2  0.30  0.80  0.72  1.27  1.03  1.55  1.34  1.60  0.99  1.56
3        3  0.43  0.42  0.50  0.44  0.65  0.56  0.73  0.60  0.63  0.85
4        4  0.25  0.33  0.28  0.43  0.47  0.79  0.38  0.42  0.39  0.51
5        5  0.90  0.31  0.48  0.45  0.46  0.46  1.09  0.46  0.67  0.86
6        6  0.19  0.42  0.46  0.30  0.21  0.55  0.28  0.41  0.49  0.63
Ich habe mir zwei Vorgehensweisen überlegt:

1. Man könnte eine lineare Regression einzeln für alle Produkte durchführen, die abhängige Variable wären die Werte (Preisdifferenzen), die unabhängige Variable die Jahre (2010-2020). Beispielhaft ist das ganze nachfolgend mal für Produkt 1 aufgeführt.

Code: Alles auswählen

   Werte Jahre
1   0.28  2010
2   0.32  2011
3   0.50  2012
4   0.57  2013
5   0.63  2014
6   0.45  2015
7   0.84  2016
8   0.53  2017
9   0.78  2018
10  0.58  2019
2. Man könnte auch alle Werte als abhängige Variable und die Jahre + Produktkategorien als unabhängige Variablen nutzen.
Hierfür muss man Dummys kodieren. Auch diesen Datensatz habe ich nachfolgend aufgeführt.

Code: Alles auswählen

   Werte Jahre Produkt_1 Produkt_2 Produkt_3 Produkt_4 Produkt_5 Produkt_6
1       0.28  2010         1         0         0         0         0         0
2       0.30  2010         0         1         0         0         0         0
3       0.43  2010         0         0         1         0         0         0
4       0.25  2010         0         0         0         1         0         0
5       0.90  2010         0         0         0         0         1         0
6       0.19  2010         0         0         0         0         0         1
7       0.32  2011         1         0         0         0         0         0
8       0.80  2011         0         1         0         0         0         0
9       0.42  2011         0         0         1         0         0         0
10      0.33  2011         0         0         0         1         0         0
11      0.31  2011         0         0         0         0         1         0
12      0.42  2011         0         0         0         0         0         1
13      0.50  2012         1         0         0         0         0         0
14      0.72  2012         0         1         0         0         0         0
15      0.50  2012         0         0         1         0         0         0
16      0.28  2012         0         0         0         1         0         0
17      0.48  2012         0         0         0         0         1         0
18      0.46  2012         0         0         0         0         0         1
19      0.57  2013         1         0         0         0         0         0
20      1.27  2013         0         1         0         0         0         0
21      0.44  2013         0         0         1         0         0         0
22      0.43  2013         0         0         0         1         0         0
23      0.45  2013         0         0         0         0         1         0
24      0.30  2013         0         0         0         0         0         1
25      0.63  2014         1         0         0         0         0         0
26      1.03  2014         0         1         0         0         0         0
27      0.65  2014         0         0         1         0         0         0
28      0.47  2014         0         0         0         1         0         0
29      0.46  2014         0         0         0         0         1         0
30      0.21  2014         0         0         0         0         0         1
31      0.45  2015         1         0         0         0         0         0
32      1.55  2015         0         1         0         0         0         0
33      0.56  2015         0         0         1         0         0         0
34      0.79  2015         0         0         0         1         0         0
35      0.46  2015         0         0         0         0         1         0
36      0.55  2015         0         0         0         0         0         1
37      0.84  2016         1         0         0         0         0         0
38      1.34  2016         0         1         0         0         0         0
39      0.73  2016         0         0         1         0         0         0
40      0.38  2016         0         0         0         1         0         0
41      1.09  2016         0         0         0         0         1         0
42      0.28  2016         0         0         0         0         0         1
43      0.53  2017         1         0         0         0         0         0
44      1.60  2017         0         1         0         0         0         0
45      0.60  2017         0         0         1         0         0         0
46      0.42  2017         0         0         0         1         0         0
47      0.46  2017         0         0         0         0         1         0
48      0.41  2017         0         0         0         0         0         1
49      0.78  2018         1         0         0         0         0         0
50      0.99  2018         0         1         0         0         0         0
51      0.63  2018         0         0         1         0         0         0
52      0.39  2018         0         0         0         1         0         0
53      0.67  2018         0         0         0         0         1         0
54      0.49  2018         0         0         0         0         0         1
55      0.58  2019         1         0         0         0         0         0
56      1.56  2019         0         1         0         0         0         0
57      0.85  2019         0         0         1         0         0         0
58      0.51  2019         0         0         0         1         0         0
59      0.86  2019         0         0         0         0         1         0
60      0.63  2019         0         0         0         0         0         1
Beim zweiten Vorschlag müsste man zunächst herausfinden ob sich die Preisdifferenzen im Zeitverlauf verändern bzw. wie sie sich verändern um im Anschluss daran diejenigen Produkte zu identifizieren die für diese Veränderung der Preisdifferenzen verantwortlich sind.

Wie würdest du an die Fragestellung herangehen?

Ich hoffe ich konnte meine Fragestellung etwas präzisieren :).

Vielen Dank vorab für deine Hilfe!

Liebe Grüße
Tobi
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Preisanalyse

Beitrag von bigben »

Fledermaus hat geschrieben: Do Aug 27, 2020 3:53 pm 1. Man könnte eine lineare Regression einzeln für alle Produkte durchführen, die abhängige Variable wären die Werte (Preisdifferenzen), die unabhängige Variable die Jahre (2010-2020).
Das ist ein naheliegender, guter und erprobter Ansatz. Du hast dann nachher soviele Steigungen wie Du Produktkategorien hast. Die Frage ist, wie Du die dann weiterverarbeiten willst. Du könntest beispielsweise eine Clusteranalyse machen und schauen, ob man sinnvoll in Produkte mit steigender und sinkender Preisdifferenz unterscheiden kann oder Du könntest eine mittlere Preisdifferenzzunahme berechnen. Oder Du könntest frei (möglichst substantiell begreündet definieren, was eine große und was eine kleine Preisdifferenzzunahme sein soll". Kommt halt drauf an, was das eigentliche Ziel ist.
Außerdem müsstest Du überlegen, ob Du das mit den Rohpreisen oder mit standardisierten Preisen machen willst: Sollen Preiszunahmen von primär teuren Produkten als absolute Werte oder als Prozente vom Ausgangspreis berücksichtigt werden?

2. Man könnte auch alle Werte als abhängige Variable und die Jahre + Produktkategorien als unabhängige Variablen nutzen.
Hierfür muss man Dummys kodieren. Auch diesen Datensatz habe ich nachfolgend aufgeführt.
Du musst in R nicht händisch Dummyvariablen erstellen. Wenn die Produktkategorien als factor hinterlegt sind, übernehmen die Regressionsfunktionen das für Dich. Du musst also keine Angst haben, für 2000 Produktkategorien 1999 Dummys erzeugen zu müssen.

Was Du da vorschlägst ist ein fixed effects model. Weißt Du etwas über random effects models? Wenn nicht, lies mal ein wenig dazu nach.

... um im Anschluss daran diejenigen Produkte zu identifizieren die für diese Veränderung der Preisdifferenzen verantwortlich sind.

Wie würdest du an die Fragestellung herangehen?
Wenn das Identifizieren einzelner Produkte das Ziel ist, dann würde ich tendenziell für jedes Produkt eine gesonderte Regression rechnen und die Identifikation über die dabei je Produkt errechneten Koeffizienten machen. Wenn ein Gesamtverhalten des Marktes ohne Blick auf die einzelne Produktkategorie das Ziel ist, würde ich zu einem random/mixed effects model tendieren.

Es kommt halt auf das große Ziel am Ende an.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten