Seite 1 von 1

Gute Datensätze

Verfasst: Mi Apr 22, 2020 2:06 pm
von Stefan
Hallo Leute,

wo bekomme ich denn gute Datensätze her?

Am besten sollten diese Datensätze auf deutsch sein.

Von meinen Dozenten habe ich folgende Seiten vorgeschlagen bekommen:

http://archive.ics.uci.edu/ml/datasets.php
https://www.kaggle.com/datasets

Da ich ziemlich neu in dem Thema Statistik bin, habe ich noch keinen großen Durchblick.

Viele Grüße

Re: Gute Datensätze

Verfasst: Mi Apr 22, 2020 3:03 pm
von ruedi_br
Fragt sich, zu welchem Zweck? Klassifikation, Regression, unsupervised learning?
Heise hatte mal eine ganz nette Übersicht mit Links zu statistischem Bundesamt/Landesämtern:
https://www.heise.de/ct/ausgabe/2015-12 ... icle-links
VG Ruedi

Re: Gute Datensätze

Verfasst: Mi Apr 22, 2020 3:27 pm
von Stefan
Danke für die Antwort.

Ich denke es geht um die Klassifikation.

Wir sollen uns einen Datensatz raus suchen und diesen dann in verschiedene Diagramme auswerten.
Die Diagramme sollen dann von uns beschrieben werden.

Re: Gute Datensätze

Verfasst: Mi Apr 22, 2020 4:10 pm
von ruedi_br
Kaggle war doch schon kein schlechter Tip. Dort findet sich z.B. der Klassiker, der Iris-Datensatz
https://www.kaggle.com/antoniolopez/iri ... ion-with-r
VG
Ruedi

Re: Gute Datensätze

Verfasst: Mi Apr 22, 2020 4:16 pm
von EDi

Re: Gute Datensätze

Verfasst: Do Apr 23, 2020 8:23 am
von student
Die EU bietet auch etwas an: https://data.europa.eu/euodp/de/data/

Re: Gute Datensätze

Verfasst: Do Apr 23, 2020 3:31 pm
von bigben
Die in R mitgelieferten Datensätze kann man sich anzeigen lassen mit

Code: Alles auswählen

data()
. Packages, die sich mit Klassifikation beschäftigen, kommen oft mit Beispieldatensätzen. Auch die kann man sich anzeigen lassen:

Code: Alles auswählen

data(package="rpart")
Sonst vielleicht https://www.data-archive.ac.uk/find/

LG,
Bernhard