Gruppenzuordnung von Datensätzen auf Basis von Keywords für SEO Anwendung
Verfasst: Mo Apr 17, 2017 1:14 pm
Hallo,
ich bin kein Statistiker, auch kein Mathematiker, sondern Programmierer, hauptsächlich Internetprojekte. Bitte bei folgender Aufgabenstellung um Unterstützung:
Gegeben ist folgende Matrix:
ID KW01 KW02 KW03 KW04 KW05 ..KW90
-------------------------------------------------------
1 0 1 1 0 1 0
2 1 0 0 0 1 0
3 0 0 0 0 0 1
4 0 0 1 0 0 1
5 1 1 0 1 1 0
usw.
ID ist die eindeutige Datensatznummer, und KW001 bis KW90 sind die Keywordspalten. 1 in KW01 bedeutet das Keyword ist eingetragen, 0 bedeutet kein Eintrag. Ein Datensatz bzw. in einer Zeile, können zwischen 1 und ca. 10 Keywords eingetragen sein.
Ziel ist es, die ID`s einer von z.B. 10 Gruppen zuzuordnen. Ich habe es mit der Clusteranalyse probiert, jedoch bekomme ich, wahrscheinlich aufgrund meiner fehlenden Kenntnisse, keine vernünftigen Daten raus. Wobei ich 300 Zeilen mit zufälligen (vielleicht liegt es daran) Keywords Einträgen generiert habe (siehe TestdateiSEO in Excel). Meine Fragen:
1. Ist das mit R bzw. mit Statistik möglich?
2. Falls ja, wie ist die Herangehensweise?
3. Oder ist das eher ein Fall für ein neuronales Netz?
Danke!
Mamgoo
ich bin kein Statistiker, auch kein Mathematiker, sondern Programmierer, hauptsächlich Internetprojekte. Bitte bei folgender Aufgabenstellung um Unterstützung:
Gegeben ist folgende Matrix:
ID KW01 KW02 KW03 KW04 KW05 ..KW90
-------------------------------------------------------
1 0 1 1 0 1 0
2 1 0 0 0 1 0
3 0 0 0 0 0 1
4 0 0 1 0 0 1
5 1 1 0 1 1 0
usw.
ID ist die eindeutige Datensatznummer, und KW001 bis KW90 sind die Keywordspalten. 1 in KW01 bedeutet das Keyword ist eingetragen, 0 bedeutet kein Eintrag. Ein Datensatz bzw. in einer Zeile, können zwischen 1 und ca. 10 Keywords eingetragen sein.
Ziel ist es, die ID`s einer von z.B. 10 Gruppen zuzuordnen. Ich habe es mit der Clusteranalyse probiert, jedoch bekomme ich, wahrscheinlich aufgrund meiner fehlenden Kenntnisse, keine vernünftigen Daten raus. Wobei ich 300 Zeilen mit zufälligen (vielleicht liegt es daran) Keywords Einträgen generiert habe (siehe TestdateiSEO in Excel). Meine Fragen:
1. Ist das mit R bzw. mit Statistik möglich?
2. Falls ja, wie ist die Herangehensweise?
3. Oder ist das eher ein Fall für ein neuronales Netz?
Danke!
Mamgoo