reciprocal_smallest_distance

Software kuvakaappaus:
reciprocal_smallest_distance
Ohjelmiston tiedot:
Versio: 1.1.5
Lähetyksen päivämäärä: 20 Feb 15
Lupa: Vapaa
Suosio: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance on pairwise orthology algoritmi, joka käyttää maailmanlaajuisesti sekvenssirinnastuksen ja suurimman uskottavuuden evolutiivisen etäisyys sekvenssit tarkasti havaitsee ortologeille välillä genomien.
Asentaminen tarpaketin
Lataa ja Pura uusin versio github:
cd ~
kiemura -L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
Asenna reciprocal_smallest_distance, varmista käyttää Python 2.7:
cd reciprocal_smallest_distance-VERSIO
python setup.py asentaa
käyttäminen RSD Etsi Othologs
Seuraava esimerkki komennot osoittaa pääasiallista tapaa juosta rsd_search. Jokainen vetoaminen rsd_search edellyttää täsmennetään sijainnin FASTA- alustettu järjestyksessä tiedosto kaksi genomien, nimeltään kyselyn ja aihe genomien. Niiden järjestys on mielivaltainen, mutta jos käytät --ids vaihtoehtoa, tunnukset on tultava kyselyn genomista. Sinun täytyy myös määrittää tiedoston kirjoittaa tulokset ortologeille saapuvat RSD algoritmi. Muoto tuotoksen tiedosto sisältää yhden ortologi riviä kohden. Jokainen rivi sisältää hakusekvenssistä id, aihe järjestyksessä id, ja etäisyys (laskettu codeml) sekvenssien välillä. Voit vaihtoehtoisesti määrittää tiedoston, joka sisältää tunnukset käyttäen --ids vaihtoehto. Sitten RSD hakee vain ortologeille niille ids. Käyttämällä --divergence ja --evalue, sinulla on mahdollisuus käyttää eri kynnysarvoja päässä oletusarvot.
Saat apua miten ajaa rsd_search, rsd_blast tai rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Etsi ortologeille kaikkien sekvenssien kyselyn ja aihe genomien käyttäen oletuksena eroja ja evalue kynnykset
rsd_search -q esimerkkejä / genomien / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomin = esimerkkejä / genomien / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Löydä ortologeille useilla ei-oletus eroja ja evalue kynnykset
rsd_search -q esimerkkejä / genomien / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomin = esimerkkejä / genomien / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Se ei ole tarpeen muotoilla FASTA- tiedoston BLAST tai laskea BLAST osuu koska rsd_search tekee sen puolestasi.
Kuitenkin, jos aiot käynnissä rsd_search useita kertoja samaan genomien, erityisesti suurten genomien, voit säästää aikaa käyttämällä rsd_format ja preformatting FASTA- tiedostot ja rsd_blast sen precomputing BLAST osuu. Ajettaessa rsd_blast, varmista, että käytät --evalue yhtä suuri kuin suurin evalue kynnys aiot antaa rsd_search.
Tässä on, miten muotoilla pari FASTA- tiedostojen paikallaan:
rsd_format -g esimerkkejä / genomien / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g esimerkkejä / genomien / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Ja tässä miten muotoilla FASTA- tiedostoja, mikä johtaa toiseen hakemistoon (nykyisen hakemiston tässä tapauksessa)
rsd_format -g esimerkkejä / genomien / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -D.
rsd_format -g esimerkkejä / genomien / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -D.
Tässä on miten laskea eteenpäin ja taaksepäin blast osumia (käyttäen oletus evalue):
rsd_blast -v -q esimerkkejä / genomien / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomin = esimerkkejä / genomien / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-osumia q_s.hits --reverse-osumia s_q.hits
Tässä on miten laskea eteenpäin ja taaksepäin blast osumia rsd_search käyttäen genomien jo alustettu räjähdys ja ei-oletus evalue
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-genomin = Mycobacterium_leprae.aa
--forward-osumia q_s.hits --reverse-osumia s_q.hits
--no-muodossa --evalue 0,1
Etsi ortologeille kaikkien sekvenssien kyselyn ja aihe genomien käyttäen genomien jo alustettu blast
rsd_search -q Mycoplasma_genitalium.aa
--subject-genomin = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-muodossa
Etsi ortologeille kaikkien sekvenssien kyselyn ja aihe genomien käyttäen osumia jo laskettu. Huomaa, että --no-formaatti on mukana, koska sillä räjähdys osumia on jo laskettu genomien ei tarvitse muotoillaan blast.
rsd_search -v --query-genomin Mycoplasma_genitalium.aa
--subject-genomin = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-osumia q_s.hits --reverse-osumia s_q.hits --no-muodossa
Etsi ortologeille erityisiä sekvenssien kyselyn genomissa. Löytää ortologeille vain muutaman sekvenssejä käyttäen --no-blast-välimuisti voi nopeuttaa laskentaa. YMMV.
rsd_search -q esimerkkejä / genomien / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genomin = esimerkkejä / genomien / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o esimerkkejä / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids esimerkkejä / Mycoplasma_genitalium.aa.ids.txt --no-blast-välimuisti
Output tiedostomuodot
Ortologeille voidaan tallentaa useissa eri muodoissa käyttäen --outfmt mahdollisuus rsd_search. Oletusmuoto, --outfmt -1, viittaa --outfmt 3. innoittamana UniProt dat tiedostoja, joukko ortologeille alkaa parametrien linja, sitten on 0 tai enemmän ortologi linjat, sitten on päätyrajan. Parametes ovat kyselyn genomin nimi, aihe genomin nimi, divergenssi kynnys, ja evalue kynnys. Jokainen ortologi on yhdellä rivillä luetellaan hakusekvenssistä id, aihe järjestyksessä id, ja suurimman uskottavuuden etäisyyden arvio. Tämä muoto voi edustaa ortologeille useita parametriryhmittelyt yhteen tiedostoon sekä parametriryhmittelyt ilman ortologeille. Sen vuoksi se sopii käytettäväksi rsd_search kun määrittelemällä useita eroja ja evalue kynnysarvot.
Tässä on esimerkki, joka sisältää 2-parametrin yhdistelmiä, joista yksi ei ole ortologeille:
PA tLACJO tYEAS7 ± 0,2 t1e-15
TAI tQ74IU0 tA6ZM40 t1.7016
TAI tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP ± 0,2 t1e-15
//
Alkuperäinen muoto RSD, --outfmt 1, on säädetty taaksepäin yhteensopivuus. Jokainen rivi sisältää ortologi, edustettuina kohdesekvenssi id, hakusekvenssiin id, ja suurin todennäköisyys etäisyys arvio. Se voi edustaa vain yksiä ortologeille tiedostoon.
Esimerkki:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Myös säädetyt taaksepäin yhteensopivuus on muotoa käytetään sisäisesti Roundup (http://roundup.hms.harvard.edu/), joka on kuin alkuperäinen RSD muodossa, paitsi hakusekvenssiin id sarake ennen kohdesekvenssi id.
Esimerkki:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Vaatimukset :

  • Python
  • NCBI- BLAST 2.2.24
  • PAML 4,4
  • Kalign 2,04

Vastaavia ohjelmistoja

mpiBLAST
mpiBLAST

3 Jun 15

Genepidgin
Genepidgin

20 Feb 15

Staden Package
Staden Package

12 May 15

edittag
edittag

20 Feb 15

Kommentit reciprocal_smallest_distance

Kommentteja ei löytynyt
Lisää kommentti
Ota kuvia!