Sample mit Bedingung

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Elmo
Beiträge: 5
Registriert: Do Feb 18, 2021 11:52 am

Sample mit Bedingung

Beitrag von Elmo »

Guten Tag,

ich analysiere Aktien auf ihren Wettereffekt, zu diesem Zweck muss ich ein sample bilden.

Pro Aktie habe in der Tabelle jeweils den Preis und die gehandelten Volumina, das Sample muss zufällig von R gewählt sein. Allerdings benötige ich für meine OLS Regression nur die Preise pro Aktie, gibt es eine Möglichkeit nur die Preise pro Sample wählen in einem Sample, also R sozusagen R zu befehlen alle Überschriften oder Namen mit dem Beisatz TURNOVER.BY.VOLUME zu ignorieren.
Schon mal vielen Dank für eure Hilfe.
Benutzeravatar
EDi
Beiträge: 1436
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Sample mit Bedingung

Beitrag von EDi »

Bitte ein reproduzierbares Beispiel posten.

Sonst bezweifle ich dass irgendjemand genau verstehen kann was mit
befehlen alle Überschriften oder Namen mit dem Beisatz TURNOVER.BY.VOLUME zu ignorieren.
gemeint ist.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Elmo
Beiträge: 5
Registriert: Do Feb 18, 2021 11:52 am

Re: Sample mit Bedingung

Beitrag von Elmo »

Ok, ich versuche mal

Datum Aktie A Aktie A Turnover.by.volume Aktie B Aktie B Turnover. by. Volume Aktie C Aktie C Turnover. by . Volume
1.1.2001 30.38 76 24.7 NA 21.5 NA
2.2.2001 27.95 47,2 24.4 NA 21.5 NA



Das als Beispiel, das echte Beispiel ist länger und ausführlicher und auch zu groß um es händisch zu verändern. Die erste Spalte einer Aktie beschreibt, dabei den Preis und die nachfolgende das Volumen, diese möchte ich allerdings herausfiltern, bzw nicht Teil eines zufällig ausgewählten Samples sein lassen
bigben
Beiträge: 2172
Registriert: Mi Okt 12, 2016 9:09 am

Re: Sample mit Bedingung

Beitrag von bigben »

Hallo Elmo,

ist das wirklich Dein bester Versuch, Leuten die Dir helfen wollen das Problem zu erklären? Mal ehrlich, wenn Du nicht schon wüsstest, worum es geht, würdest Du Deine Beschreibung verstehen?

Hier steht was über reproduzierbare Beispiele: viewtopic.php?f=20&t=11
Hier steht was über Tabellen im Forum: viewtopic.php?f=20&t=29
Hier steht, wie man Spalten in Datensätzen löscht: https://homepage.ruhr-uni-bochum.de/Ste ... mgang.html

Wenn Du den letzten Link studiert hast, sollte das hier das erklären, was ich mir aus Deiner "Beschreibung" zusammengereimt habe, was Du vielleicht gemeint haben könntest:

Code: Alles auswählen

head(iris)
print(names(iris))
# Welche Spaltennamen enthalten "Length"?
del <- grep("Length", names(iris))
print(del)
# Spalte 1 und 3 enthalten "Length"
head(iris[,-c(1,3)])
Gruß,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Elmo
Beiträge: 5
Registriert: Do Feb 18, 2021 11:52 am

Re: Sample mit Bedingung

Beitrag von Elmo »

Ohh tut mir leid, dann versuche ich es nochmal erneut und hänge eine CSV Datei an um mein Problem besser zu visualisieren.
Testdatei R.csv
Zur Visualisierung meines Problems
(230 Bytes) 4-mal heruntergeladen
Ich muss eine OLS-Regression machen, zu diesem Zwecke muss ich eine zufällige Stichprobe aus dem Datensatz ziehen, der Datensatz besteht aus mehreren Aktien, pro Aktie ist spaltenweise einmal der Preis pro Aktie gelistet und das Volumen der Aktie. Spalte A beschreibt also zum Beispiel den Tagespreis der Aktie und Spalte B die Anzahl der verkauften Aktien, für die Regression ist für mich allerdings nur Zeile A relevant in dem Sample. Spalte B bzw. die Volumina dürfen nicht Teil der zufälligen gezogenen Stichprobe sein. Mein Problem ist jetzt, dass ich keine zufällige Stichprobe erhalte ohne auch Volumina in der Stichprobe zu haben. Meine Frage ist nun ob irgendeiner von euch eine Lösung für mein Problem hat, wie ich möglicherweise codiere, dass diese Daten aus der Stichprobe ausgeschlossen werden. Ich hoffe mein Problem ist nun verständlicher.
schubbiaschwilli
Beiträge: 168
Registriert: Di Jun 27, 2017 12:09 pm

Re: Sample mit Bedingung

Beitrag von schubbiaschwilli »

Gude!

Die Diskussionen zu so einem Thema hatten wir schon mehrfach, und nun ja, es war kontrovers.
Einen Überblick gibt es hier: viewtopic.php?f=18&t=2930 - Wo ich auch auf eine andere Diskussion verweise - Naja, für den Einstieg vielleicht etwas zu viel.

Trotzdem:
Ich muss eine OLS-Regression machen
Sicher? (Dazu später mehr.)
zu diesem Zwecke muss ich eine zufällige Stichprobe aus dem Datensatz ziehen
Nochmal: Sicher? Ich nehme an, die Daten liegen als Zeitreihe vor. Dann willst du wahrscheinlich dein Modell kreuzvalidieren. Dazu teilst du deinen Datensatz in einen Trainings- und einen Testdatensatz. Mit dem Trainingsdatensatz trainierst (yep!) du dein Modell, und mit dem Testdatensatz testest (yep!) du, wie gut dein Modell ist. Beispielsweise könnte man (bei Tagesdaten) ungefähr 90 (Kalender-)Tage nehme, also bspw. den 1.1.-31.3., und mit diesen Tagen trainierst du dein Modell, und mit diesem Modell prognostizierst du den 1.4. - Dann nimmst du den 2.1.-1.4. zum Trainieren, und prognostizierst den 2.4. usw.usf.

Ich bin mir nicht sicher, ob du das willst - Denn dazu müsstest/solltest du vorher getestet haben, ob sowas überhaupt geht. Und dazu benötigt man erst einmal keine Regression. Es gibt aber Paper ("The Halloween Indicator, ‘Sell in May and Go Away’: Another Puzzle" ), die eine lineare Regression durchführen, da es damit einfacher ist, an alle Werte der t-Tests zu kommen - Und an dieser Stelle sind wir an der Frage nach der Regression. Davon abgesehen, prognostiziert man in der Regel nicht die Kurse, sondern die Returns.

2 Nachträge:
1. Die Begriffe (Training, Test, Kreuzvalidierung...) sind nicht so 100%ig definiert - Das kann also verwirren.
2. Da wir diese Diskussionen ja öfters haben, überlege ich echt, mal eine kleine Anleitung zu machen, wie man sowas...

Dank&Gruß
schubbiaschwilli
Edit: Fehlerchen...
Elmo
Beiträge: 5
Registriert: Do Feb 18, 2021 11:52 am

Re: Sample mit Bedingung

Beitrag von Elmo »

Ja, die Log-Renditen wurde ich anschließend aus den Daten aus dem Sampel bilden, aber dafür müsste ich zunächst erstmal ein die Aktienpreise in einem zufälligen Sampel vorliegen haben.

Und eine OLS Regression mache ich auf Vorschlag meines Professors.
Aber danke für den Verweis :)
schubbiaschwilli
Beiträge: 168
Registriert: Di Jun 27, 2017 12:09 pm

Re: Sample mit Bedingung

Beitrag von schubbiaschwilli »

Gude!

Du willst nicht dein Modell kreuzvalidieren? (Ich hab' gerade nach geschaut, was ich skizziert habe, bezeichnet man auch als Day Forward-Chaining.) Also ich würde so etwas tun - Oder was meinst du mit "Aktienpreise in einem zufälligen Sampel"?
Und lass mich raten: Bachelorarbeit BWL, irgendwas mit Finanzen?

Dank&Gruß
Schubbiaschwilli
Edit: Tippfehler
Elmo
Beiträge: 5
Registriert: Do Feb 18, 2021 11:52 am

Re: Sample mit Bedingung

Beitrag von Elmo »

Hi,
ich habe bisher zumindest nicht über eine Kreuzvalidierung nachgedacht, aber ich lasse mich gerne vom Gegenteil überzeugen.

Ich möchte eine zufällige Testprobe von R wählen lassen, um einen Auswahlbias zu umgehen, das meine ich mit Sample. (Sorry für die falsche Schreibweise vorhin. )
Und jap erwischt.

Gruß,
Elmo
Benutzeravatar
EDi
Beiträge: 1436
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Sample mit Bedingung

Beitrag von EDi »

Also Zeilen und spalten kann man mit

Code: Alles auswählen

?`[`
auswählen.
Anscheinend willst du ja einige Spalten (turnover?) nicht haben.

Zufällige Proben kann man mit ?sample ziehen.
Kombiniert man sample mit [, kann man z.b. zufällige Zeilen ziehen.

Ohne ein reproduzierbares Beispiel und eine klare Problemstellung versteje ich aber deine Frage leider nicht.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten