Multiple-complete-digest restriction fragment mapping: Generating sequence-ready maps for large-scale DNA sequencing (Suomi)

RESULTS

the experimental procedures behind MCD mapping are showed in Fig. 1, ja käsitteellinen katsaus tähän prosessiin on esitetty kuvassa. 2. Molekyylibiologian standardiprotokollia käytetään kaikkialla. MCD-kartoitusta varten on kuitenkin tehty useita mukautuksia, joiden tarkoituksena on tuottaa riittävän laadukkaita tietoja., Erittäin laadukkaat geelikuvat ovat välttämättömiä, koska fragmenttien kokomittausten tarkkuus määrittää sormenjälkitiedon informaatiosisällön ja siten taajuuden, jolla erilaiset samankokoiset sirpaleet sekoitetaan toisiinsa. Lisäksi laajamittainen kartoitus on käytännöllistä vain silloin, kun geelikuvia voidaan analysoida automaattisesti muutamalla virheellä. Tämä tavoite on saavutettavissa vain johdonmukaisilla, korkealaatuisilla kuvilla.

iv xmlns:xhtml=”http://www.w3.org/1999/xhtml”> Kuvio 1

kaavio märkä penkki menettelyt YAC → cosmid ja BAC – → cosmid MCD kartoitus., Suurin ero on se, että vaikka BAC-DNA voidaan helposti puhdistaa bakteerikromosomaalisesta DNA: sta, ei ole olemassa hyvää preparatiivista menetelmää YAC-DNA: n erottamiseksi hiivakromosomaalisesta DNA: sta. Vuonna YAC tapauksessa pari prosenttia cosmids, jotka ovat peräisin ADWARE tunnistetaan hybridisaatio-pohjainen siirtomaa-seulonta-protokollaa. BAC-johdettujen kosmidien kanssa tämä vaihe on tarpeeton, koska kartoitusohjelmisto voi helposti poistaa pienen määrän kosmideja, jotka eivät ole peräisin BAC: stä.

Luku 2

Kaavamainen esitys MCD kartoitus prosessi., a) Geelikuva. (b) luettelo fragmenttikooista kunkin kloonin entsyymitunnuksen osalta. Numerolla merkityt kaistat tunnistavat kloonin c01: ksi tai c02: ksi. Kaistat merkitty kirjaimella M tunnistaa kokomerkit. c) kolme yhden entsyymin karttaa ovat itsenäisesti rakennettuja (oikealla). Synkronointi entsyymialueiden välillä johtaa komposiittikarttaan (vas.). Pitkä rasti merkit osoittavat väliset rajat määräsi ryhmät palasia; lyhyt pystyviivat rajata järjestämätön palasia ryhmän sisällä, mielivaltaisesti tehdä, jotta voidaan vähentää koko.,

MCD-kartoituksen onnistunut toteutus on edellyttänyt kokeellisen prosessin ja data-analysointiohjelmiston yhteiskehitystä. Yksi esimerkki tästä vuorovaikutuksesta on kosmidivektorin suunnittelu. Haulikon sekvensoinnissa vektorin tulisi olla mahdollisimman pieni, jotta vektorin toistuvaan sekvensointiin liittyvät yleiskustannukset olisivat mahdollisimman pienet. Sillä MCD kartoitus, vektori pitäisi sisältää sivustoja kartoitus entsyymejä ja antaa ole mahdollisuutta luominen artifactual päällä vektori-insertti junction (esim.,, kun Mboi partial-digest fragmentti on ligated osaksi BamHI Kloonaus sivusto, on mahdollista, että artifactual BamHI sivusto luodaan risteyksessä). Kun vektori s-Cos-DBI käytetään klooni MboI osittainen-digest palasia, yksi vektori-fragmentti, joka sisältää tunnetun vähimmäiskoko (3205 bp) on tuotettu jokaisen meidän kolme entsyymi verkkotunnuksia. Koska tämä vektori-sisältää fragmentti ei edusta mitään täysin sulavaa fragmentti taustalla genomin, se tunnistetaan geeli-siirto hybridisaatio ja poistaa luettelosta fragmentteja käytetään karttaa kokoonpano.,

merkittävä parannus kuvanlaadussa saavutettiin vaihtamalla intercalating dye SYBR–green I: een.geeliskannerin käyttämän 488 nm: n magnetointiaallonpituudella huomaamme, että SYBR–green I on viisi kertaa herkempi kuin tiatsolioranssi, joka puolestaan on kolme kertaa herkempi kuin etidiumbromidi. Tyypillisesti lataamme vain 15 ng cosmid DNA per gel lane käytettäessä SYBR-green I tahrata geelit tavallisiin mittoihin. Paikallisen ylikuormituksen aiheuttama kaistavääristymä ei ole koskaan ongelma, koska suurimmat bändit sisältävät vain 5-10 ng DNA: ta., Lisäksi, kun käytämme DNA: ta, joka on vain kohtalaisen puhdasta, kuten teemme, rajoituskaivosten puhtaus liittyy käänteisesti bakteeriviljelmän tilavuuteen, josta DNA: ta uutetaan. SYBR-green I on vähentänyt huomattavasti huonojen tai epäonnistuneiden sulamisten vuoksi käyttökelvottomien geelikaistojen määrää. Ainoa vakava komplikaatio on, että, tuntemattomasta syystä, SYBR green I näyttää kapea ja vaihteleva alue, jonka yli integroitu fluoresenssi kasvaa lineaarisesti määrä DNA-bändissä.,

sirpalekokojen Automaattinen, vankka ja tarkka määritys edellyttää huolellisesti suunniteltuja DNA: n kokomerkkejä. Ihannetapauksessa merkkikaistat olisi sijoitettava tasaisesti kokoliikkuvuuskäyrän kaaripituutta pitkin. Siellä on kasvava määrä merkki bändejä kuten fragmentti koko lähestyy kynnystä, jossa liikkuvuudet tullut koko riippumattomia. Huomiota käyrä-asennus vakautta tällä alueella mahdollistaa erinomaisen fragmentti mitoitus tarkkuus jopa 15 kbp (SD ± 1%) ja riittävä fragmentti mitoitus tarkkuus jopa 40 kbp (SD ± 5%)., Toinen vaatimus on, että on oltava kolme bändiä, jotka on helppo tunnistaa paikallinen intensiteetti maxima. Näiden huomiota herättävien nauhojen tunnustaminen nukleoi automaattisen kuviointimenetelmän, jolla kuvaanalyysiohjelmisto tunnistaa merkkinauhat. Meidän standardi geeli muodossa (Kuva. 3), sarjaa kuusi digest kaistat ovat vierekkäin kaksi merkkikaistat. Geelin kaikkia viittä merkkikaistaa käytetään kaksiulotteisessa interpolointialgoritmissa, joka määrittää koot digest-nauhoille.

kuva 3

harmaan asteikon kuva tyypillisestä SYBR–vihreällä I: llä poststainoidusta kartoitusgeelistä., Merkkikaistoja on viisi, sijoilla 1, 8, 15, 22 ja 29. Jokaisen merkkikaistaparin väliin on sijoitettu kaksi kloonia, joista kukin on sulanut itsenäisesti EcoRI -, HindIII-ja NsiI-bakteereilla (ja lastattu siinä järjestyksessä).

restriction digest-kuvioon liittyvä kuva-analyysiongelma on varsin erilainen kuin sekvensointiportaisiin liittyvä ”base calling” – ongelma. Base calling software tarvitsee vain tunnistaa hallitseva bändi jokaisessa tikapuuasennossa., Sen sijaan rajoituskuvioiden analysointiin suunnitelluissa ohjelmissa on määritettävä kunkin kaistan sirpaleiden määrä,sillä kaikki samankokoiset sirpaleet voivat komigroitua missä tahansa kaistalla. Normaaleissa elektroforeettisissa olosuhteissa kahden tai kolmen taajuusalueen kerrannaisvaikutukset ovat yleisiä. Bändi multiplicities on laskettava huolimatta vähenevän signaali-kohinasuhteessa pieni fragmentti koot ja nonlinearities suhdetta integroitu fluoresenssin intensiteetti ja DNA: n määrä per bändi. Nämä kuvaominaisuudet voivat vaihdella kaistasta toiseen jopa samalla geelillä., Tehokkaiden kuva-analyysiohjelmistojen on otettava huomioon kaikki tällaiset kokeelliset realiteetit. Tyypillisen geelikaistan analyysi on esitetty kuvassa. 4. Olemme nyt onnistuneesti analysoineet yli 1000 geeliä ohjelmistollamme ja kaiken kaikkiaan se on lähes yhtä hyvä kuin asiantuntijatulkki. Se tekee joitakin virheitä, joita ihmisasiantuntija ei tekisi, mutta se myös analysoi oikein monia bändejä, joita asiantuntija laskisi väärin.

Kuva 4

agarose-geelikuvien käsittely. (a) Vääränvärinen kuva digestistä kuvassa näkyvän geelin kaistalta 11. 3., Täysikaistainen kuva näkyy (vasemmalla), ja ”zoomilla” rajatun alueen intensiteettikorskattu kuva näkyy (oikealla). Valkoiset palkit viittaavat nauhoihin, jotka tunnistetaan automaattisesti Kuva-analyysiohjelmiston avulla. Fragmenttikoot emäspareina on merkitty, ja mahdolliset band multiplicities suurempi kuin yksi annetaan suluissa. (B) koko kaistan (ylempi) ja zoomausalueen (Alempi) yksiulotteinen esitys. Romahdus yhteen ulottuvuuteen tapahtuu mediaanistisella keskiarvoistamisjärjestelmällä. Jokainen rivi analysoidaan erikseen., Pikselit lajitellaan ensin intensiteetin mukaan, ja kiinteä määrä pienimmän intensiteetin pikseleitä eliminoidaan geelikaistojen välisen kuilun huomioon ottamiseksi. Lopusta lasketaan keskimmäisen kvartiilin keskiarvo. C) fragmentti lasketaan kaistalle, joka sisältää kahdeksan sinkkua, kolme kaksinverroin ja yhden tripletin. Fragment count-arviot perustuvat integroidun kaistan intensiteetin ja fragment-koon trendiin. Tämä suuntaus vaihtelee geelistä geeliin ja on erittäin epälineaarinen., Jokainen digest lane geeli, jota ei ole hylätty, koska huono data analysoidaan samanaikaisesti rakentaa komposiitti trendi linja suhde integroitu intensiteetti ja DNA määrä.

järjestelmän keskeinen ominaisuus on heikkolaatuisten tietojen automaattinen hylkääminen. Ongelman alkuperää ei pyritä selvittämään. Ohjelmisto on sisäinen malli siitä, mitä hyvä tiedot lane pitäisi näyttää, ja se torjuu lane, joka ei täytä tätä mallia., Osittainen luettelo havaituista ongelmatyypeistä sisältää poistetut kloonit, sekoitetut kloonit, osittaiset sulat, epäonnistuneet sulat, pilkkoutuminen toissijaisilla paikoilla, ylikuormitetut kaistat, alleadatut kaistat ja lian geelissä. Nykykäytännössä geelikaistoista 80-90 prosenttia on käyttökelpoisia. Hyviäkin väyliä voi kuitenkin tulkita väärin. Tehokas keino väärintulkintojen havaitsemiseen on sirpaleiden summa-konsistenssitesti., Lukuun ottamatta muutamien puuttuvien pienten, alle 500 bp: n kokoisten fragmenttien osuuksia, joiden odotetaan keskimäärin olevan alle 1% kosmidin kokonaispituudesta, fragmenttien summan pitäisi olla yhdenmukainen entsyymialueiden välillä. Se voi vaihdella 40-50 kbp kloonista klooniin, mutta entsyymistä entsyymiin tietyn kloonin kokonaispoikkeamat yli 1 tai 2 kbp ovat lähes varmoja merkkejä siitä, että kuva-analyysissä on jotain vikaa., Käyttämällä tätä testiä havaita väärinanalysoitu kaistat, ja manuaalisesti korjata fragmentti laskee, olemme olennaisesti eliminoitu fragmentti laskuvirhe kaikilla kaistoilla suurempi kuin 2 kbp.

MCD-karttakokoonpanon automaattinen vaihe etenee sarjana vaiheita, joiden aikana kloonin päät ja rajoituksen fragmenttien järjestys tarkentuu asteittain (16, 17). Fragmentti mitoitus poikkeamia käsitellään ”gray zone” käsite. Matalampaa harmaan vyöhykkeen kynnystä tarkempi fragmenttipari hyväksytään automaattisesti, ellei se loukkaa kartan topologista rajoitetta., Harmaalla vyöhykkeellä sirpaleita tehdään vain, jos niitä tarvitaan topologisen johdonmukaisuuden vuoksi; muuten niitä lykätään. Harmaan vyöhykkeen ylempää kynnystä vähemmän tarkat pairingit hylätään suoralta kädeltä. Asetamme tällä hetkellä harmaan vyöhykkeen kynnysarvot 2,0 ja 4,0 prosenttiin suurimman osan käyttökelpoisesta kokoluokasta. Kynnysarvoja nostetaan sekä suurten fragmenttien osalta (elektroforeettisen erotuskyvyn vakavan menetyksen vuoksi) että pienten fragmenttien osalta (johtuen elektroforeettisen erotuskyvyn kohtalaisesta häviämisestä ja taajuusalueen laajenemisesta)., Tilastolliset poikkeamat jäävät yleensä harmaan vyöhykkeen alapuolelle. Voimassa parit päätyvät harmaa vyöhyke ensisijaisesti seurauksena multiplet-yhtye, joka ei ole kunnolla hajottaa kuva-analyysi-ohjelmisto, osaksi sen osa palasia.

lopulta tarkkojen karttojen saamisen avain piilee ”fix it as you grow” – strategiassa. Lähtökohta on, että virheet ovat harvinaisia, koska syöttötiedot ovat laadukkaita., Kun virheitä tapahtuu, ja riippumatta siitä, johtuvatko ne kloonauspoikkeamista, kuva-analyysivirheistä tai karttakokoonpanovirheistä, ongelma rajoittuu yleensä vain yhteen kolmesta entsyymialueesta. Usein ongelma rajoittuu yhteen klooniin. Epäillyn kloonin poistaminen mahdollistaa kartan kasvun. Kun kartta ulottuu epäillyn kloonin päähän, on yleensä melko helppo selvittää, miksi kyseinen klooni alun perin sekaantui karttakasvuun., Jos ongelma on ilmeinen virhe kuva-analyysissä tai vektorikaistatunnistuksessa, korjaamme tietojoukon ja laitamme kloonin takaisin karttaan. Korkeissa näytteenottosyvyyksissämme nämä karttarakentamisen rajoitukset ovat riittävän voimakkaita kaikkialla, mutta päissä, jotta lähes kaikki virheet voidaan havaita ja korjata. Mahdolliset havaitsemattomat virheet ovat joko kloonin pituisia kartan lopussa tai alueella, jolla kattavuus on poikkeuksellisen alhainen.

Taulukko 1 on yhteenveto YAC → cosmid-kartoista, jotka olemme rakentaneet ihmisen kromosomille 7., Jokaista katkelmaa ei ole tilattu, ja paikallisesti rajoittamattomat katkelmat sijoitetaan ”fragmenttiryhmiin.”Useimmissa tapauksissa on keskimäärin 1,2–1,3 esteetöntä fragmenttia per fragmentti ryhmä, mikä tarkoittaa, että lähestymme tarkasti tavoitetta tilata kaikki rajoituksen fragmentit. Kuvassa on tyypillinen MCD-kartta, jossa yhdistyvät neljän itsenäisesti rakennetun YAC → cosmid-kartan tulokset. 5. Korkeat näytteenottosyvyydet mahdollistavat todella minimaalisen laatoituspolun valinnan, jonka päällekkäisyydet ovat vain muutamia kilobaasipareja., YAC fidelity vahvistetaan vertaamalla näiden itsenäisesti rakennettujen karttojen päällekkäisiä alueita. Toistaiseksi poikkeamia ei ole löytynyt. Vielä tiukempana YAC-uskollisuuden testinä otimme sormenjäljet kirjastosta, joka oli suoraan subklonoitu samasta hybridisolulinjasta, jota käytettiin YACs: n rakentamiseen (E. D. Green, julkaisemattomat tulokset). Näiden kosmidien ja YAC-kloonien välillä ei havaittu eroja. Suositut käsitykset YAC: n epävakaudesta perustuvat pitkälti kokemuksiin suhteellisen pienestä kirjastomäärästä., Näiden tulosten perusteella voidaan rakentaa vakaita YAC-kirjastoja ja käyttää yacs-kirjastoja systemaattisen sekvensoinnin lähtöklooneina.

View tässä taulukossa:

  • Näkymä-inline
  • Näytä ponnahdusikkuna
Taulukko 1

Yhteenveto YAC → cosmid MCD karttoja osia ihmisen kromosomi 7

Kuva 5

Edustaja MCD kartta kromosomi 7. Tämän 400 kbp: n alueen kartoittamiseksi kosmideiksi luokiteltiin neljä hybridisolulinjasta johdettua Yacia., Lisäksi erityinen cosmid kirjasto saadaan suoraan hybridi-solulinjassa (eli ei johdettu YAC klooni) oli myös sijoitettu kartalle, jossa ei ole epäjohdonmukaisuuksia. Kartta on kuvattu aivan ylemmän mittakaavan tangon alapuolella. Entsyymi verkkotunnukset EcoRI, HindIII, ja NsiI on kuvattu, ylhäältä alas, punainen, vihreä ja sininen. Tilatut ryhmät fragmentit erotetaan pitkä rasti markkaa, ja järjestämättömiä palasia ryhmän sisällä on erotettu lyhyt rasti markkaa. Minimal-laatoitus-polku kloonit näkyvät violetti alla kartan., Laatoituspolku-kloonien alla on esitetty suurempi joukko klooneja: tämä joukko sisältää kaikki kloonit lukuun ottamatta niitä, joiden fragmenttipitoisuus on sama tai osajoukko kuin näytetyn kloonin. Seuraava on viiden histogrammin sarja. Ylhäältä alas, ne heijastavat cosmid kattavuus on johdettu seuraavista lähteistä: cosmid kirjasto valmistetaan suoraan hybridi-solulinja, DNA, yWSS1613, yWSS771, yWSS1572, ja yWSS1434. Histogrammien alla on kartaston laatuarviointi, joka perustuu atlakseen (E. Thayer, julkaisematon teos).,

– Meillä on nyt jaksotetaan cosmids lähes 1 Mbp DNA, jonka kartoitus on esitetty Taulukossa 1. Haulikon sekvensointitietoja analysoitiin Phred/Phrap-sekvenssi-assembly-järjestelmällä (P. Green, julkaisemattomat tulokset). Kartoitusvirheitä ei havaittu, kun sekvenssijohdettuja karttoja verrattiin MCD-karttoihin. Ei vain olivat fragmentteja oikein tilata, mutta tarkkuus heille mitään-mutta meille välit oli alle 1%, vaikkakin systemaattinen virhe hieman enemmän kuin 1% suurempia palasia., Testissä mukana olleissa kartoissa oli yli 700 erilaista rajoituskappaletta. Riippumattomassa MCD: n kartoitus/haulikon sekvensointihankkeessa, jonka koko oli yhtä suuri HLA-luokan I alueella ihmisen kromosomissa 6, saatiin samanlaisia tuloksia (D. E. Geraghty, T. Guillaudeux ja M. Janer, julkaisemattomia tuloksia). HLA-projektissa havaittiin yhden kartan lopussa yksi kartoitusvirhe, joka jäljitettiin 600 bp multiplet-kaistan virheeseen yhdessä kosmidissa. Ajantasaiset kartat, sekvenssit ja ohjelmistodokumentaatiot löytyvät verkkosivuiltamme osoitteesta http://www.genome.washington.edu.

Leave a Comment