Burrows-Wheeler Aligner (BWA) on tehokas ohjelma, joka tasaa suhteellisen lyhyt nukleotidisekvenssit vastaan pitkä referenssijakson kuten ihmisen genomin.
Ohjelmisto toteuttaa kaksi algoritmeja, BWA-lyhyt ja BWA-SW. Entinen teokset tutkittaessa sekvenssejä, lyhyempi kuin 200 bp ja jälkimmäinen pidempään sekvenssit noin 100kbp.
Molemmat algoritmit tehdä aukolliselle linjaus. Ne ovat yleensä tarkempia ja nopeampia kyselyjä vähän virheitä hinnat. Katso BWA manuaalisivu saadaksesi lisätietoja.
Onko BWA kohdista 454 lukee?
& Nbsp; Kyllä ja ei. BWA-SW komponentti BWA toimii hyvin 454 lukee noin 200 bp tai kauemmin. Se yltää samoihin kohdistustarkkuuteen kohteeseen SSAHA2 samalla paljon nopeammin. BWA-SW toimii myös lyhyempiä lukee, mutta herkkyys on pienempi. Lisäksi BWA-SW ei tue pariksi-end linjaus.
Mikä on suurin kysely sekvenssipituus linjassa?
& Nbsp; on suositeltavaa käyttää vain BWA-lyhyt lukee lyhyempi kuin 200 bp. Vaikka BWA-novelleja jopa muutaman kbp kyselyn periaatteessa sen suorituskyky on huonontunut. Pitkiä lukee, BWA-SW on parempi.
& Nbsp; BWA-SW komponentti voi tasata BAC-sekvenssi (noin 150kbp) vastaan ihmisen genomin. Nopeus mitattuna linjassa emäksistä aikayksikössä on verrattavissa nopeus 1kbp lukea linjaus. Periaatteessa BWA-SW olisi voitava tasata muutaman Mbp viitesekvenssiin vastaavassa nopeudella, mutta en ole kokeillut.
Mikä on toleranssi sekvensointivirheitä?
& Nbsp; Bwa-lyhyt on pääasiassa suunniteltu sekvensointiin virhetasot alle 2%. Vaikka käyttäjät voivat kysyä sitä sietää enemmän virheitä tuning komentorivivaihtoehdot, sen suorituskyky on nopeasti huonontunut. Huomaa, että Illumina lukee, BWA-lyhyt voi mahdollisesti leikata huonolaatuinen emäksiä 3'-päähän ennen linjausta ja pystyy näin yhdenmukaistaa enemmän lukee korkea virheprosentti pyrstössä, joka on tyypillinen Illumina tietoja.
& Nbsp; BWA-SW sietää enemmän virheitä antanut enää linjaus. Simulaatio ehdottaa, että BWA-SW voi toimia hyvin antanut 2% virhe 100bp linjaus, 3% virhe 200 bp, 5% 500 bp ja 10% 1000bp tai kauemmin linjaus.
Onko BWA löytää kimeeri- lukee?
& Nbsp; Kyllä, BWA-SW komponentti pystyy löytämään kimeeraa. BWA yleensä raportoi yksi linjaus kutakin lukea, mutta se voi tuottaa kaksi tai useampia linjaukset jos luku / contig on kimeeran.
Onko BWA puhelu SNP kuin MAQ?
& Nbsp; o, BWA vain tekee linjaus. Siitä huolimatta se tuottaa linjauksia SAM muodossa, joka tukee useita yleisiä SNP soittajat kuten samtools ja GATK.
näen yhden luettuna pari on korkea kartoitus laatu, mutta muut Read nolla. Onko tämä oikein?
& Nbsp; Tämä on oikea. Mapping laatu osoitetaan yksittäisille lukea, ei lukea pari. On mahdollista, että yksi luku voidaan kartoittaa yksiselitteisesti, mutta sen kaveri putoaa tandom toista ja siten sen tarkka kanta ei voida määrittää.
Näen lukea erottuu loppuun kromosomi ja on merkitty unmapped (lippu 0x4). Mitä täällä tapahtuu?
& Nbsp; Sisäisesti BWA ketjuttaa kaikki viitesekvenssit yhdeksi pitkä sarja. Lue voidaan kartoittaa risteyksessä kahden vierekkäisen viitesekvenssit. Tällöin BWA tulee lippu kuulumaan unmapped, mutta näet asennossa, sikari ja kaikki tunnisteet. Parempi ratkaisu olisi valita vaihtoehtoinen asema tai leikata linjaus pois lopussa, mutta tämä on melko monimutkainen ohjelmointi ja ei toteuteta tällä hetkellä.
ei BWA työtä viitesekvenssit kauemmin kuin 4GB yhteensä?
& Nbsp; Ei, tämä ei ole mahdollista, ja ei tueta lähitulevaisuudessa vuoksi teknisen monimutkaisuuden mukana.
Errata strong>
Pääte joukko välein tyhjän merkkijonon jos [0, n-1] jossa n on pituus tietokannan string, ei [1, n-1] todetaan Li ja Durbin (2009 ja 2010). Vastaavasti meidän on määriteltävä O (, -1) = 0 ja tarkistaa pseudokoodina kuvassa 3 Li ja Durbin (2009). BWA toteutus on todella oikea. Virhe ilmenee vain paperiin. Pahoittelemme sekaannusta ja kiittää Nils Homer ja Abel Antonio Carrion Colladoa huomautti tästä.
Mitä uutta strong> tässä julkaisussa:
- Bugikorjaus: monistaa vaihtoehto osumia XA tag.
- Bugikorjaus: trimmatessasi käytössä, BWA-aln trimmit 1BP vähemmän.
- Ei käytössä väriavaruuden linjaus. 0.6.x ei toimi kiinteällä lukee tällä hetkellä.
- Bugikorjaus: segfault johtuu liiallisesta epäselvä emäksiä.
- Bugikorjaus: virheellinen mate asema SE-tilassa.
- Bugikorjaus: harvinainen segfault PE-tilassa
- Kun makro _NO_SSE2 on käytössä, laskee takaisin normaaliasentoon Smith-Waterman
- sijasta SSE2- SW.
- Vaihtoehtoisesti merkin kohdalta osuu alemman turvautui tulokset toissijaisina.
- Bugikorjaus: ääretön silmukka aiheuttama epäselvä emäksiä.
- Vaihtoehtoisesti lähtö viitesekvenssin.
Kommentteja ei löytynyt