Seite 1 von 2

Problem bei verbindung zu HTML

Verfasst: Mo Nov 19, 2018 8:55 pm
von Kramer
Moin,

Code: Alles auswählen

XXX<-read_html('http://www.boerse-frankfurt.de/anleihen/kurshistorie/Inh-Schv_v20122019-Anleihe-2019-AT0000A0U9J2/FSE/1.5.2017_19.11.2018#Kurshistorie')


Get_Link_Histo<- function (Link) {
  try(
    xml_attrs(xml_child(xml_child(xml_child(xml_child(xml_child(xml_child(xml_child(read_html(Link),2),4),1),12),1),1),4))
  )
}

Get_Link_Histo('http://www.boerse-frankfurt.de/anleihen/kurshistorie/Inh-Schv_v20122019-Anleihe-2019-AT0000A0U9J2/FSE/1.5.2017_19.11.2018#Kurshistorie')
Das ist mein derzeitiger Code, mit der Webseite die ich bearbeite. Der Link beinhaltet eine Tabelle mit historischen Kursen die ich extrahieren möchte. Dazu habe ich im Inspektor geschaut wo die infos stehen und dann in XXX aus meinem code, wie ich an die Infos rankomme um das dann in der obigen Funktion einzusetzen. Das ganze habe ich schon einmal gemacht, da hat alles super funktioniert, hier ist aber folgendes Problem: Ich habe in der Funktion schon die ersten xml_child() gesetzt, die gehen auch alle in die richtige Richtung, wenn ich dann aber in meinem XXX nachgucke gibt es keine weiteren <div> mehr, im Inspektor werden mir aber noch welche angezeigt. -Dewegen komme ich leider nicht an die gewünschte Tabelle ran. Weiss jemand woran das liegt und kann mir helfen?

Viele Grüße

Re: Problem bei verbindung zu HTML

Verfasst: Di Nov 20, 2018 12:19 pm
von Kramer
Okay, vielleich anders gefragt, wie bekomme ich die Tabelle "Historische Kurse Scholz Holding" von der Webseite:
http://www.boerse-frankfurt.de/anleihen ... rshistorie

Re: Problem bei verbindung zu HTML

Verfasst: Di Nov 20, 2018 12:58 pm
von Athomas
Also - zumindest ich bin mir nicht zu schade, im Notfall so eine Datei per "cut and paste" zu holen!?

Re: Problem bei verbindung zu HTML

Verfasst: Di Nov 20, 2018 1:05 pm
von Kramer
Ich möchte ja nicht nur diese Daten, sondern das ganze für hunderte von Webseiten.

Re: Problem bei verbindung zu HTML

Verfasst: Di Nov 20, 2018 1:08 pm
von Athomas
Ich möchte ja nicht nur diese Daten, sondern das ganze für hunderte von Webseiten.
Das hatte ich befürchtet, warum fragst Du dann
wie bekomme ich die Tabelle "Historische Kurse Scholz Holding" von der Webseite
:? ?

Re: Problem bei verbindung zu HTML

Verfasst: Di Nov 20, 2018 1:22 pm
von Kramer
Weil ich ja schon daran scheitere es von nur einer Webseite zu holen :?

Gerne formuliere ich das ganze auch um, ich habe eine Data table mit knapp 3700 Links zu denen ich jeweils die Daten aus der Tabelle haben möchte.
Hier die Struktur meines Table, mit 4 Beispielen:

Code: Alles auswählen

df <- structure(list(carb = c('000A0U9J2', '000A0V7D8', '000A0VL70', '000A0VLS5'), optden = c('http://www.boerse-frankfurt.de/anleihen/kurshistorie/Inh-Schv_v20122019-Anleihe-2019-AT0000A0U9J2/FSE/1.5.2017_19.11.2018#Kurshistorie', 
                                                                                  'http://www.boerse-frankfurt.de/anleihen/kurshistorie/Strabag_SEEO-Schuldverschr_201219-Anleihe-2019-AT0000A0V7D8/FSE/1.5.2017_19.11.2018#Kurshistorie', 'http://www.boerse-frankfurt.de/anleihen/kurshistorie/BorealisEO-Schuldv_201219-Anleihe-2019-AT0000A0VL70/FSE/1.5.2017_19.11.2018#Kurshistorie', 'http://www.boerse-frankfurt.de/anleihen/kurshistorie/AndritzEO-Anleihe_201219-Anleihe-2019-AT0000A0VLS5/FSE/1.5.2017_19.11.2018#Kurshistorie')), .Names = c("ISIN", "LINK"
                                                                                  ), row.names = c("1", "2", "3", "4"), class = "data.frame")

Re: Problem bei verbindung zu HTML

Verfasst: Mi Nov 21, 2018 8:55 pm
von student
Hallo und hier meine 2-Cent:

Vorweg, nicht schimpfen! Was ich anbiete ist nicht R, sondern Excel: Daten -> Aus dem Web. Siehe Bild! ;)

Re: Problem bei verbindung zu HTML

Verfasst: Do Nov 22, 2018 12:16 pm
von Kramer
Danke für die Antwort, das hilft mir aber leider nicht viel weiter.

Ich erhalte auch über diese Methode nicht die gewünschte Tabelle, siehe Anhang. Genau wie über R finde ich sie einfach nicht. Ausserdem muss ich das ganze 4000 mal machen, ich weiss nicht ob das mit ecxel so gut funktioniert.

Hat jemand denn mal hier reingeschaut?

Code: Alles auswählen

XXX<-read_html('http://www.boerse-frankfurt.de/anleihen/kurshistorie/Inh-Schv_v20122019-Anleihe-2019-AT0000A0U9J2/FSE/1.5.2017_19.11.2018#Kurshistorie')
Findet ihr die Tabelle auch nicht? Woran liegt das? Gibt es eine andere Möglichkeit an die Tabelle zu kommen?

VG

Re: Problem bei verbindung zu HTML

Verfasst: Do Nov 22, 2018 9:12 pm
von student
Ist nicht einfach. Hast Du es mal mit php probiert?

Re: Problem bei verbindung zu HTML

Verfasst: Fr Nov 23, 2018 5:47 pm
von Kramer
Habe es mit Docker gelöst, danke für deine Hilfe.