Käyttämäni genomidata, poisluettuna suomalaisnäytteet, on saatavana täältä . Tiedostopaketti sisältää kolme tiedostoa, itse datan, SNP-listan ja näytelistan. Datan rivit sisältävät kunkin näytteen 136835 SNP-arvoa koodattuna. Koodit ovat
0 - homozygootti A-alleeli
1 - heterozygootti
2 - homozygootti B-alleeli
-1 - "no-call" eli arvo puuttuu
Rivejä on 667 vastaten näytelistaa.
Koodaus A- ja B-alleeleihin on yleinen tutkijoiden käyttämä tapa. Tutustu esimerkiksi GEO:n dataan.
Paketista purettua datatiedoa voi käsitellä parhaiten Editpad Lite -ohjelmalla, joka sopii suurten character-tiedostojen editointiin. Ohjelman saa ladattua täältä .
PCA-tilastojen teko on hepointa R:llä. Tilasto-ohjelman R saat ladattua täältä . Koodaukseni käy suoraan R:n toiminnoille. Omia näytteitäsi varten sinun tarvitsee rajata näytteesi SNP-listan mukaan, koodata A/T ja C/G -arvot numeerisiksi, "transposeta" näytteesi ja lisätä ne esimerkiksi Editpad Litellä muihin projektidatasta valitsemiisi näytteisiin. "Transposen" pitäisi onnistua R:ssä, mutta myös Past kykenee siihen pienemmillä näytemäärillä, joskin sillä voit tehdä tilastoja vain 10000 SNP:n määrään asti.
Tilaa:
Lähetä kommentteja (Atom)
Some ancestral changes in Iron Age Estonia
QpAdm was designed to detect admixtures giving also probability and standard error statistics. Two kind of parameters are inputted: admixtu...
-
Testing ancient "steppe" samples on PCA together with modern ones revealed unexpected issues. Studies have included different set...
-
A new article taking place before the study tells that at least four of around twenty samples in a southwestern Iron Age cemetery (Luistari)...
-
A month ago we saw a new study, Allentoft et al. with new earlier unpublished data regarding several Bronze Age cultures. Altogethe...
Ei kommentteja:
Lähetä kommentti