Umwandeln Matrix in Tabelle, bzw Extraktion eines Datenteils
Verfasst: Di Apr 10, 2018 9:07 am
Hallo!
Ich bin neu hier und blutiger R-Anfänger und komme gerade nicht weiter:
Ich habe eine Datenmatrix, die ich gerne in Tabelle umwandeln würde, bzw wäre es vielleicht noch einfacher nur den 2.Teil der Matrix (hat 2 Zeilen) zu extrahieren, dann hätte ich so etwas wie ein fasta.file.
In der ersten Zeile steht die Spaltenüberschrift, in der 2. Zeile die Daten:
die Spalten in Zeile 1 ( pro eintrag 4 Spalten, ) haben folgendes Format:
"id" "name" "gene" "sequence" "id.1" "name.1" "gene.1" "sequence.1" "id.2" "name.2" "gene.2" "sequence.2" "id.3" "name.3" "gene.3" "sequence.3"
ein Dateneintrag (Info der 4 Spalten) sieht so aus:
"NOMAM148-17" "Capreolus capreolus" "NOMAM148-17" "TACTCTATACTTGTTATTTGGTGCTTGAGCAGGCATAGTAGGAACAGCCCTAAGTCTATTAATCCGTGCTGAGCTAGGTCAACCTGGGACTCTACTAGGAGATGATCAAATTTATAACGTAATTGTAACCGCACATGCATTTGTAATAATTTTCTTTATAGTAATACCAATTATGATTGGAGGATTTGGTAATTGACTTGTCCCCTTAATAATTGGTGCCCCAGATATAGCATTCCCTCGGATAAATAATATAAGTTTCTGACTACTTCCCCCTTCTTTCTTATTACTCCTAGCATCATCTATAGTTGAAGCCGGAGCAGGAACAGGCTGAACCGTTTATCCCCCCTTGGCCGGTAATTTAGCTCACGCAGGAGCTTCAGTAGACTTAACTATTTTTTCTCTGCATTTAGCAGGTGTTTCTTCAATTCTAGGGGCTATTAATTTTATTACAACAATTATTAATATAAAACCTCCTGCTATATCACAATATCAAACCCCTTTATTTGTATGATCCGTATTAATTACTGCAGTATTACTACTTCTCTCACTTCCTGTGCTAGCAGCAGGGATCACAATACTGTTAACAG"CCGAAACTTAAATACAACTTTCTTTGACCCAGCAGGAGGCGGAGACCCTATCCTGTACCAACACTTATTT
Irgendwie sind es 5 Spalten, 5. Spalte wäre am Anfang die fortlaufende Nummer
die Daten sind Tab- getrennt
Meine Frage wäre nun, hat jmd eine Idee, wie ich die Info in ne Tabelle bekomme, bzw. falls noch einfacher,
das ersehnte Fasta.file:
(dabei wäre zu Beginn jeder Zeile ein > Zeichen:
> NOMAM148-17 Capreolus capreolus NOMAM148-17
TACTCTATACTTGTTATTTGGTGCTTGAGCAGGCATAGTAGGAACAGCCCTAAGTCTATTAATCCGTGCTGAGCTAGGTCAACCTGGGACTCTACTAGGAGATGATCAAATTTATAACGTAATTGTAACCGCACATGCATTTGTAATAATTTTCTTTATAGTAATACCAATTATGATTGGAGGATTTGGTAATTGACTTGTCCCCTTAATAATTGGTGCCCCAGATATAGCATTCCCTCGGATAAATAATATAAGTTTCTGACTACTTCCCCCTTCTTTCTTATTACTCCTAGCATCATCTATAGTTGAAGCCGGAGCAGGAACAGGCTGAACCGTTTATCCCCCCTTGGCCGGTAATTTAGCTCACGCAGGAGCTTCAGTAGACTTAACTATTTTTTCTCTGCATTTAGCAGGTGTTTCTTCAATTCTAGGGGCTATTAATTTTATTACAACAATTATTAATATAAAACCTCCTGCTATATCACAATATCAAACCCCTTTATTTGTATGATCCGTATTAATTACTGCAGTATTACTACTTCTCTCACTTCCTGTGCTAGCAGCAGGGATCACAATACTGTTAACAG"CCGAAACTTAAATACAACTTTCTTTGACCCAGCAGGAGGCGGAGACCCTATCCTGTACCAACACTTATTT
Ich hoffe durch Anwendung der Befehle, langsam mich in R einzuarbeiten,
über jeden Hinweis und Tipp wäre ich sehr dankbar,
bitte relativ detailliert beschreiben, da ich wirklich sehr am Anfang stehe,
(auch was das Einlesen der files angeht,..)
vielen Dank, Kata
Ich bin neu hier und blutiger R-Anfänger und komme gerade nicht weiter:
Ich habe eine Datenmatrix, die ich gerne in Tabelle umwandeln würde, bzw wäre es vielleicht noch einfacher nur den 2.Teil der Matrix (hat 2 Zeilen) zu extrahieren, dann hätte ich so etwas wie ein fasta.file.
In der ersten Zeile steht die Spaltenüberschrift, in der 2. Zeile die Daten:
die Spalten in Zeile 1 ( pro eintrag 4 Spalten, ) haben folgendes Format:
"id" "name" "gene" "sequence" "id.1" "name.1" "gene.1" "sequence.1" "id.2" "name.2" "gene.2" "sequence.2" "id.3" "name.3" "gene.3" "sequence.3"
ein Dateneintrag (Info der 4 Spalten) sieht so aus:
"NOMAM148-17" "Capreolus capreolus" "NOMAM148-17" "TACTCTATACTTGTTATTTGGTGCTTGAGCAGGCATAGTAGGAACAGCCCTAAGTCTATTAATCCGTGCTGAGCTAGGTCAACCTGGGACTCTACTAGGAGATGATCAAATTTATAACGTAATTGTAACCGCACATGCATTTGTAATAATTTTCTTTATAGTAATACCAATTATGATTGGAGGATTTGGTAATTGACTTGTCCCCTTAATAATTGGTGCCCCAGATATAGCATTCCCTCGGATAAATAATATAAGTTTCTGACTACTTCCCCCTTCTTTCTTATTACTCCTAGCATCATCTATAGTTGAAGCCGGAGCAGGAACAGGCTGAACCGTTTATCCCCCCTTGGCCGGTAATTTAGCTCACGCAGGAGCTTCAGTAGACTTAACTATTTTTTCTCTGCATTTAGCAGGTGTTTCTTCAATTCTAGGGGCTATTAATTTTATTACAACAATTATTAATATAAAACCTCCTGCTATATCACAATATCAAACCCCTTTATTTGTATGATCCGTATTAATTACTGCAGTATTACTACTTCTCTCACTTCCTGTGCTAGCAGCAGGGATCACAATACTGTTAACAG"CCGAAACTTAAATACAACTTTCTTTGACCCAGCAGGAGGCGGAGACCCTATCCTGTACCAACACTTATTT
Irgendwie sind es 5 Spalten, 5. Spalte wäre am Anfang die fortlaufende Nummer
die Daten sind Tab- getrennt
Meine Frage wäre nun, hat jmd eine Idee, wie ich die Info in ne Tabelle bekomme, bzw. falls noch einfacher,
das ersehnte Fasta.file:
(dabei wäre zu Beginn jeder Zeile ein > Zeichen:
> NOMAM148-17 Capreolus capreolus NOMAM148-17
TACTCTATACTTGTTATTTGGTGCTTGAGCAGGCATAGTAGGAACAGCCCTAAGTCTATTAATCCGTGCTGAGCTAGGTCAACCTGGGACTCTACTAGGAGATGATCAAATTTATAACGTAATTGTAACCGCACATGCATTTGTAATAATTTTCTTTATAGTAATACCAATTATGATTGGAGGATTTGGTAATTGACTTGTCCCCTTAATAATTGGTGCCCCAGATATAGCATTCCCTCGGATAAATAATATAAGTTTCTGACTACTTCCCCCTTCTTTCTTATTACTCCTAGCATCATCTATAGTTGAAGCCGGAGCAGGAACAGGCTGAACCGTTTATCCCCCCTTGGCCGGTAATTTAGCTCACGCAGGAGCTTCAGTAGACTTAACTATTTTTTCTCTGCATTTAGCAGGTGTTTCTTCAATTCTAGGGGCTATTAATTTTATTACAACAATTATTAATATAAAACCTCCTGCTATATCACAATATCAAACCCCTTTATTTGTATGATCCGTATTAATTACTGCAGTATTACTACTTCTCTCACTTCCTGTGCTAGCAGCAGGGATCACAATACTGTTAACAG"CCGAAACTTAAATACAACTTTCTTTGACCCAGCAGGAGGCGGAGACCCTATCCTGTACCAACACTTATTT
Ich hoffe durch Anwendung der Befehle, langsam mich in R einzuarbeiten,
über jeden Hinweis und Tipp wäre ich sehr dankbar,
bitte relativ detailliert beschreiben, da ich wirklich sehr am Anfang stehe,
(auch was das Einlesen der files angeht,..)
vielen Dank, Kata