Also ich habe den folgenden Code dazu geschrieben:
Code: Alles auswählen
header_indices <- grep("<h2", webseite, ignore.case = TRUE)
# Finden der Überschrift, die das Wort "Länder" enthält
laender_header_index <- grep("Länder", webseite[header_indices], ignore.case = TRUE)
# Setzen des Startindexes, falls "Länder" gefunden wurde
start_index <- header_indices[laender_header_index]
# Bestimmen des Endindexes: entweder die nächste <h2> oder das Ende der Seite
end_index_candidates <- header_indices[header_indices > start_index]
end_index <- c(end_index_candidates, length(webseite) + 1)[1]
# Extrahieren der relevanten Zeilen, inklusive der Überschrift "Länder", wenn sie existieren
laender_zeilen <- ifelse(length(start_index) > 0, list(webseite[start_index:(end_index - 1)]), list(character(0)))[[1]]
# Ausgabe der relevanten Zeilen (wird nur ausgegeben, wenn sie gefunden wurden)
print(laender_zeilen