Du sammelst ja nur Textvorschläge für Topics - die, die Dir davon sinnvoll erscheinen, markierst Du ja anschließend für den 2. Schritt - und nur die werden extrahiert!?
Ja, ich sammle die Topics und das was unter den Topics steht, so war der Plan.
Ich schicke dir morgen mal die .xlsx. Würde die ...
Die Suche ergab 10 Treffer
- Sa Sep 05, 2020 9:49 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
- Sa Sep 05, 2020 5:15 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Hallo allerseits,
der Kipptaucher ist wieder da. Ich hab die parallelisierte Variante unter Linux bis zur Erstellung der Topics.xlsx durchlaufen lassen. Läuft schnell und ist sehr gründlich. Danke für den Code, Wie erwartet summieren sich da auch eine Menge Müll drunter. Ich zweifel langsam, ob ...
der Kipptaucher ist wieder da. Ich hab die parallelisierte Variante unter Linux bis zur Erstellung der Topics.xlsx durchlaufen lassen. Läuft schnell und ist sehr gründlich. Danke für den Code, Wie erwartet summieren sich da auch eine Menge Müll drunter. Ich zweifel langsam, ob ...
- Mi Sep 02, 2020 9:14 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Man liest ja auch - wie ich es tue - mit "fread" aus data.table ein, das ist -zig mal schneller, vor allem von (NVMe-) SSD!
Gut zu wissen! Ich werde dann alles auf fread umstellen! Ich kapiere langsam, dass R nicht gleich R ist. :D
Vielleicht schafft fread auch meine Problem csv, Die hatte ...
Gut zu wissen! Ich werde dann alles auf fread umstellen! Ich kapiere langsam, dass R nicht gleich R ist. :D
Vielleicht schafft fread auch meine Problem csv, Die hatte ...
- Mi Sep 02, 2020 8:01 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Normalerweise rennst Du mit dieser Frage bei mir offene Türen ein, aber ich habe Deinen "Ernstfall" simuliert und die Beispielsdatei 1200 mal aneinandergehängt. Mein Rechner, der vor 4 Jahren top war, brauchte dafür ca. 6,5 Minuten...
Deshalb habe ich von einem Optimierungsversuch abgesehen!
Aber ...
- Mi Sep 02, 2020 6:21 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Danke! Ich werde es nachher mal ausprobieren und mir das mal genauer anschauen.
Die Idee mit dem Excel-Sheet ist Klasse. Ich nehme an, ich kann auch mehreren Topics das gleiche Feld zu weisen.
by the way: ich hab noch mal ne Frage abseits meines Thread-Themas. Lässt sich die R beschleunigen? Mein ...
Die Idee mit dem Excel-Sheet ist Klasse. Ich nehme an, ich kann auch mehreren Topics das gleiche Feld zu weisen.
by the way: ich hab noch mal ne Frage abseits meines Thread-Themas. Lässt sich die R beschleunigen? Mein ...
- Di Sep 01, 2020 10:53 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Also meine Idee war folgendermaßen: Ich strukturiere die Daten nach Topic hier wäre eine Zuordnung zur Patientid und AdmissionID auch sinnvoll, damit ich später nicht wieder durch den gesamten Freitext suchen muss. Dann Erstelle zu jedem Topic eine Art dictionary. Schaue mir das Dict auf ...
- Di Sep 01, 2020 9:33 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
@Athomas: Ich kann dir auf die PN nicht antworten.
Da bin ich ja beruhigt - ich war kurz davor, Kipptaucher-Alarm zu geben :lol: (nicht wundern, das ist so eine Art "running gag" hier im Forum).
Das mit dem Kipptaucher habe ich nach einer kurzen Suchanfrage verstanden. Und nein, ich bin kein ...
- Di Sep 01, 2020 7:39 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Danke für die beiden Antworten, wie gesagt, ich bin neu hier und im Reich der R-Programmierung. Mein weiteres vVrgehen ist die Stringanalyse der Felder Chief compliant, History of Present illness, Past medical history, Physical examination, Allergies und Discharge Diagnosis. Ich gehe da vielleicht ...
- Sa Aug 29, 2020 9:09 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Re: Strings in Dataframe nach Unterthemen durchsuchen
Es handelt sich um 49 Aufnahmen (HADM_ID) von Patienten, mancher Patient (SUBJECT_ID) kommt mehrmals darin vor. Die Begriffe sind leider mal alles groß, mal groß und klein usw. geschrieben. Zumindest zeigten das meine Stichproben. Es ist also wurscht ob groß oder klein Entscheidend ist der Begriff ...
- Sa Aug 29, 2020 7:31 pm
- Forum: Allgemeines zu R
- Thema: Strings in Dataframe nach Unterthemen durchsuchen
- Antworten: 29
- Zugriffe: 4418
Strings in Dataframe nach Unterthemen durchsuchen
Hallo,
ich bin neu hier und bin ein R Newbie. Im Rahmen meiner Doktorarbeit muss ich ein Preprocessing von großen Datensätzen durchführen. Medizinische Daten gespeichert in csv-Dateien 59.000 Patientendaten von 3 intensivstationen einer amerikanischen Klinik. Diese Tabelle enthält Ein String ...
ich bin neu hier und bin ein R Newbie. Im Rahmen meiner Doktorarbeit muss ich ein Preprocessing von großen Datensätzen durchführen. Medizinische Daten gespeichert in csv-Dateien 59.000 Patientendaten von 3 intensivstationen einer amerikanischen Klinik. Diese Tabelle enthält Ein String ...