ich bin R Anfängerin und versuche Werte innerhalb einer Spalte zu kategorisieren, um im Endeffekt bessere Association Rules zu erhalten.
Es geht um den googleplaystore Datensatz von kaggle, der die Spalte Installs enthällt. Innerhalb der Spalte gibt es viele numerische Kategorien (z.B. "1,000+"). Ich habe mir überlegt, eine neue Spalte ("new") zu erstellen und über die ifelse Funktion die Werte festzulegen. Das klappt leider überhaupt nicht.
Ich bin über jeden eurer Hinweise sehr dankbar!
Code: Alles auswählen
# 1 Einlesen des Datensatzes
app<-read.csv("googleplaystore.csv", header=TRUE, sep = ",", colClasses="factor")
class(app)
str(app)
summary(app)
# Zusammenfügen Werte in neue Kategorien
app$new <-
ifelse(app$Installs <- "1,000+"|app$Installs <-"500+"|app$Installs <-"100+"|app$Installs <-"50+"|app$Installs <-"10+","sehr niedrig",
ifelse(app$Installs <- "10,000+"|app$Installs <- "5,000+","niedrig",
ifelse(app$Installs <- "100,000+"|app$Installs <-"50,000+","gering",
ifelse(app$Installs <- "1,000,000+"|app$Installs <-"500,000+","höher",
ifelse(app$Installs <- "10,000,000+"|app$Installs <-"5,000,000+","hoch",
ifelse(app$Installs <- "100,000,000+"|app$Installs <-"50,000,000+","sehr hoch")))))