Multiple-complete-Digest restriction fragment mapping: generarea de hărți gata de secvență pentru secvențierea ADN la scară largă

rezultate

procedurile experimentale din spatele mapării MCD sunt prezentate în Fig. 1, iar o prezentare conceptuală a acestui proces este prezentată în Fig. 2. Protocoalele standard de biologie moleculară sunt folosite pe tot parcursul. Cu toate acestea, au fost făcute o serie de adaptări pentru a produce date de o calitate adecvată pentru cartografierea MCD., Imaginile cu gel de foarte bună calitate sunt esențiale deoarece precizia măsurătorilor mărimii fragmentelor determină conținutul informațional al datelor de amprentă și, prin urmare, frecvența la care diferite fragmente de dimensiuni similare sunt confundate între ele. În plus, cartografierea pe scară largă este practică numai atunci când imaginile cu gel pot fi analizate automat cu puține erori. Acest obiectiv este realizabil numai cu imagini consistente, de înaltă calitate.

iv xmlns:xhtml=”http://www.w3.org/1999/xhtml”> Figura 1

diagramă de banc umed procedurile de YAC → cosmid și BAC → cosmid MCD cartografiere., Principala diferență este că, în timp ce ADN-ul BAC poate fi ușor purificat din ADN-ul cromozomial bacterian, nu există o metodă preparativă bună pentru a separa ADN-ul YAC de ADN-ul cromozomial de drojdie. În cazul YAC, cele câteva procente din cosmidele derivate din YAC sunt identificate printr-un protocol de screening al coloniilor bazat pe hibridizare. Cu cosmidele derivate din BAC, acest pas este inutil, deoarece software-ul de cartografiere poate elimina cu ușurință numărul mic de cosmide care nu provin din BAC.

Figura 2

Reprezentarea schematică a procesului de mapare MCD., (a) Imagine cu Gel. (b) Lista dimensiunilor fragmentelor pentru fiecare domeniu enzimatic din fiecare clonă. Benzile etichetate cu un număr identifică clona ca c01 sau c02. Benzile etichetate cu litera M identifică marcatorii de dimensiune. (c) trei hărți cu o singură enzimă sunt construite independent (dreapta). Sincronizarea pe domenii enzimatice are ca rezultat o hartă compusă (stânga). Marcajele lungi indică limitele dintre grupurile ordonate de fragmente; marcajele scurte delimitează fragmente neordonate într-un grup, desenate arbitrar în ordinea descrescătoare a mărimii.,implementarea cu succes a mapării MCD a necesitat o co-evoluție a procesului experimental și a software-ului de analiză a datelor. Un exemplu al acestei interacțiuni este proiectarea vectorului cosmid. Pentru secvențierea puștii, vectorul ar trebui să fie cât mai mic posibil pentru a minimiza cheltuielile asociate cu secvențierea repetată a vectorului. Pentru maparea MCD, vectorul nu trebuie să conțină site-uri pentru enzimele de cartografiere și nu trebuie să permită crearea unui site artifact la joncțiunea vector-insert (de ex.,, atunci când un MboI parțial digerat fragment este legat într-un BamHI clonarea site-ul, acolo este o șansă că o artifactual BamHI site-ul va fi creat la intersecția). Când vectorul s-Cos-DBI este folosit pentru a clona fragmente MboI parțial digerate, un singur fragment care conține vector de dimensiune minimă cunoscută (3205 bp) este produs în fiecare dintre cele trei domenii enzimatice ale noastre. Deoarece acest fragment care conține vectori nu este reprezentativ pentru niciun fragment de digerare completă din genomul de bază, este identificat prin hibridizare cu transfer de gel și eliminat din lista fragmentelor utilizate pentru asamblarea hărții.,

O îmbunătățire majoră în calitatea imaginii s-a realizat prin trecerea la intercalating colorant SYBR–verde I. La o excitație de undă de 488 nm folosite de gel scanner, vom găsi că SYBR–I verde este de cinci ori mai sensibil decât tiazol portocaliu, care este la rândul său de trei ori mai sensibile decât bromură de etidiu. De obicei, încărcăm doar 15 ng de ADN cosmid pe banda de gel atunci când folosim SYBR–green i pentru a colora geluri de dimensiuni obișnuite. Distorsiunea benzii din cauza supraîncărcării locale nu este niciodată o problemă, deoarece cele mai mari benzi conțin doar 5-10 ng de ADN., Mai mult, atunci când folosim ADN de puritate moderată, așa cum facem noi, curățenia digestelor de restricție este invers legată de volumul culturii bacteriene din care este extras ADN-ul. SYBR-green i a redus foarte mult numărul de benzi de gel care sunt inutilizabile din cauza digestiilor slabe sau eșuate. Singura complicație gravă este că, din motive necunoscute, SYBR-green I afișează un interval îngust și variabil peste care fluorescența integrată crește liniar cu cantitatea de ADN din bandă.,Determinarea automată, robustă și precisă a dimensiunilor fragmentelor necesită markeri de dimensiune ADN atent proiectați. În mod ideal, benzile de marcare ar trebui să fie distanțate uniform de-a lungul lungimii arcului curbei de mobilitate a mărimii. Trebuie să existe un număr tot mai mare de benzi de marcare, deoarece dimensiunea fragmentului se apropie de pragul la care mobilitățile devin independente de dimensiune. Atenția la stabilitatea curbelor în această regiune permite o precizie excelentă de dimensionare a fragmentelor de până la 15 kbp (SD ± 1%) și o precizie adecvată de dimensionare a fragmentelor de până la 40 kbp (SD ± 5%)., O a doua cerință este că trebuie să existe trei benzi care sunt ușor recunoscute ca maxime de intensitate locală. Recunoașterea acestor benzi vizibile nucleează procedura automată de potrivire a modelului prin care software-ul de analiză a imaginii identifică benzile de marcare. În formatul nostru standard de gel (Fig. 3), seturi de șase benzi digest sunt flancate de două benzi de marcare. Toate cele cinci benzi de marcare de pe gel sunt utilizate în algoritmul de interpolare bidimensional care atribuie dimensiuni benzilor digest.

Figura 3

imagine la scară gri a unui gel de cartografiere tipic post-colorat cu SYBR-verde I., Există cinci benzi de marcare, la pozițiile 1, 8, 15, 22 și 29. Două clone, fiecare digerată independent cu EcoRI, HindIII și NsiI (și încărcate în această ordine) sunt plasate între fiecare pereche de benzi de marcare.

imaginea de analiză problemă asociată cu o restricție digera model este destul de diferit de „bază de asteptare” problemă asociată cu o secvențiere scara. Software-ul de apelare de bază trebuie doar să identifice banda dominantă la fiecare poziție a scării., În schimb, software-ul conceput pentru a analiza modelele de restricție trebuie să determine numărul de fragmente din fiecare bandă, deoarece orice număr de fragmente de dimensiuni similare pot comigra în orice poziție pe o bandă. În condiții electroforetice normale, multiplicitățile de bandă de două sau trei sunt comune. Multiplicitățile de bandă trebuie calculate în ciuda diminuării raporturilor semnal-zgomot la dimensiuni mici ale fragmentelor și neliniarităților în relația dintre intensitatea fluorescenței integrate și cantitatea de ADN pe bandă. Aceste caracteristici ale imaginii pot varia de la banda la banda chiar si pe acelasi gel., Software-ul eficient de analiză a imaginii trebuie să țină cont de toate aceste realități experimentale. Analiza unei benzi tipice de gel este prezentată Fig. 4. Acum am analizat cu succes peste 1.000 de geluri cu software-ul nostru și, în echilibru, este aproape la fel de bun ca un interpret expert. Face unele greșeli pe care un expert uman nu le-ar face, dar, de asemenea, analizează corect multe benzi pe care un expert le-ar număra greșit. Figura 4

prelucrarea imaginilor cu gel de agaroză. (a) Imagine în culori False A digest din banda 11 a gelului prezentat în Fig. 3., Este afișată imaginea pe toată banda (stânga) și este afișată o imagine rescalată în intensitate a regiunii delimitată de „zoom” (dreapta). Barele albe indică benzi care sunt identificate automat de software-ul de analiză a imaginii. Dimensiunile fragmentelor în perechi de baze sunt indicate și orice multiplicități de bandă mai mari decât una sunt date în paranteze. (b) reprezentarea unidimensională a benzii complete (superioară) și a regiunii de zoom (inferioară). Colapsul la o dimensiune se face cu o schemă mediană-părtinitoare medie. Fiecare rând este analizat separat., Pixelii sunt mai întâi Sortați după intensitate și un număr fix de pixeli cu cea mai mică intensitate este eliminat pentru a ține cont de decalajul dintre benzile de gel. Din restul, se calculează o medie a quartilei medii. (c) fragmentul contează pentru banda, care conține opt singlete, trei dublete și un triplet. Estimările numărului de fragmente se bazează pe tendința intensității benzii integrate față de dimensiunea fragmentului. Această tendință este variabilă de la gel la gel și este foarte neliniară., Fiecare digest lane de pe gel care nu a fost respins din cauza datelor proaste este analizată simultan pentru a construi o linie de tendință compozită pentru relația dintre intensitatea integrată și cantitatea de ADN.o caracteristică cheie a sistemului este respingerea automată a datelor de calitate scăzută. Nu se încearcă identificarea sursei problemei. Software-ul are un model intern despre cum ar trebui să arate o bandă de date bună și respinge orice bandă care nu satisface acest model., O listă parțială a tipurilor de probleme care sunt detectate include clone șterse, clone mixte, digestii parțiale, digestii eșuate, scindare la site-uri secundare, benzi supraîncărcate, benzi subîncărcate și murdărie pe gel. În practica actuală, 80-90% din benzile de gel sunt utilizabile. Cu toate acestea, chiar și benzile bune pot fi interpretate greșit. Un instrument puternic pentru detectarea interpretărilor greșite este testul de consistență a sumei de fragmente a enzimei încrucișate., Cu excepția contribuțiilor de la câteva fragmente mici lipsă de dimensiuni mai mici de 500 bp, care sunt în medie de așteptat să fie mai mică de 1% din lungimea totală cosmidă, suma fragmentelor ar trebui să fie consecventă în toate domeniile enzimatice. Acesta poate varia între 40 și 50 kbp de la clonă la clonă, dar de la enzimă la enzimă pe o clonă dată deviații totale de mai mult de 1 sau 2 kbp sunt aproape sigur indiciu că ceva nu este în regulă cu analiza imaginii., Prin utilizarea acestui test pentru a detecta misanalyzed benzi, și manual corectarea fragment contează, avem, în esență, eliminat fragment miscounts pe toate benzile mai mare decât 2 kbp.

faza automată a ansamblului hărții MCD se desfășoară ca o serie de pași în timpul cărora ordinea clonei se termină și fragmentele de restricție sunt rafinate progresiv (16, 17). Abaterile de dimensionare a fragmentelor sunt tratate de conceptul „zona gri”. O asociere fragment care este mai precis decât pragul inferior zona gri este acceptată în mod automat, cu excepția cazului în care încalcă o constrângere topologică a hărții., În zona gri, perechile de fragmente se fac numai dacă sunt necesare pentru consistența topologică; în caz contrar, ele sunt amânate. Perechile care sunt mai puțin precise decât pragul zonei gri superioare sunt respinse în mod direct. În prezent, setăm pragurile zonei gri la 2.0 și 4.0% în cea mai mare parte a intervalului de dimensiuni utilizabil. Aceste praguri sunt crescute atât pentru fragmentele mari (din cauza pierderii severe a rezoluției electroforetice), cât și pentru fragmentele mici (din cauza pierderii moderate a rezoluției electroforetice și a lărgirii crescute a benzii)., Valorile statistice se situează, în general, sub zona gri. Perechile valide ajung în zona gri în primul rând ca urmare a unei benzi multiplet care nu este descompusă corespunzător de software-ul de analiză a imaginii în fragmentele sale componente.în cele din urmă, cheia pentru a obține hărți exacte se află într-o strategie „fix it as you grow”. Premisa de bază este că erorile sunt rare, datorită calității ridicate a datelor de intrare., Când apar erori și indiferent dacă acestea se datorează aberațiilor de clonare, erorilor de analiză a imaginii sau erorilor de asamblare a hărții, problema este de obicei limitată la unul dintre cele trei domenii enzimatice. Adesea, problema este limitată la o singură clonă. Eliminarea clonei suspecte permite hărții să crească. Odată ce harta se extinde dincolo de sfârșitul clonei suspecte, este, în general, destul de ușor de determinat de ce acea clonă a interferat inițial cu creșterea hărții., Dacă problema este o greșeală evidentă în analiza imaginii sau identificarea benzii vectoriale, remediem setul de date și punem clona înapoi pe hartă. La adâncimile noastre mari de eșantionare, aceste constrângeri asupra construcției hărții sunt suficient de puternice peste tot, dar la capete pentru a permite detectarea și remedierea aproape a tuturor erorilor. Orice erori nedetectate se află fie într-o lungime de clonă de la sfârșitul hărții, fie într-o regiune cu o acoperire excepțional de mică.tabelul 1 este un rezumat al hărților YAC → cosmid pe care le-am construit pe cromozomul uman 7., Nu toate fragmentele sunt ordonate, iar fragmentele neordonate local sunt plasate în „grupuri de fragmente.”În cele mai multe cazuri, există o medie de 1,2–1,3 fragmente neordonate pe grup de fragmente, ceea ce înseamnă că abordăm îndeaproape obiectivul de a ordona toate fragmentele de restricție. O hartă MCD tipică, care combină rezultatele a patru hărți YAC → cosmid construite independent, este prezentată în Fig. 5. Adâncimile mari de eșantionare permit selectarea unei căi de placare cu adevărat minime, cu suprapuneri de doar câteva perechi de kilobase., Fidelitatea YAC este validată prin compararea regiunilor care se suprapun între aceste hărți construite independent. Până în prezent, nu au fost găsite discrepanțe. Ca și mai riguros încercare de YAC fidelitate, ne-a amprentat o mică colecție de cosmids dintr-o bibliotecă, care a fost direct subclonat din același hibrid linie de celule utilizate pentru a construi YACs (E. D. Verde, rezultate nepublicate). Nu s-au găsit discrepanțe între aceste cosmide și cele derivate din clonele YAC. Percepțiile populare despre instabilitatea YAC se bazează în mare parte pe experiența cu un număr relativ mic de biblioteci., Ceea ce stabilesc aceste rezultate este că bibliotecile YAC stabile pot fi construite și că YACs poate fi folosit ca clone de pornire pentru secvențierea sistematică.

vezi acest tabel:

  • vezi inline
  • vezi popup
Tabelul 1

Rezumatul YAC → hărți cosmid MCD pentru porțiuni ale cromozomului uman 7

Figura 5

harta MCD reprezentativă din cromozomul 7. Patru YAC-uri derivate din linii celulare hibride au fost subclonate în cosmide pentru a cartografia această regiune de 400 kbp., În plus, pe această hartă a fost plasată și o bibliotecă cosmid specială derivată direct din linia celulară hibridă (adică nu derivată dintr-o clonă YAC), fără inconsecvențe. Harta este reprezentată chiar sub bara de scară superioară. Domeniile enzimatice EcoRI, HindIII și NsiI sunt reprezentate, de sus în jos, în roșu, verde și albastru. Grupurile ordonate de fragmente sunt separate prin semne de căpușă înalte, iar fragmentele neordonate din cadrul unui grup sunt separate prin semne de căpușă scurte. Minimal-tigla-cale Clone sunt afișate în violet chiar sub hartă., Sub clonele căii de placare, este afișat un set mai mare de clone: acest set include toate clonele, cu excepția celor al căror conținut de fragment este identic sau un subset de cel al unei clone afișate. Următoarea este o serie de cinci histograme. De sus în jos, ele reflectă cosmid acoperire obținute din următoarele surse: cosmid biblioteca pregătit direct de hibrid linie de celule ADN, yWSS1613, yWSS771, yWSS1572, și yWSS1434. Sub histograme este o evaluare a calității hărții bazată pe atlas (E. Thayer, lucrare nepublicată).,

acum am secvențiat cosmidele de la aproape 1 Mbp din ADN a căror mapare este rezumată în tabelul 1. Datele de secvențiere a puștii au fost analizate cu sistemul de asamblare a secvenței Phred/Phrap (P. Green, rezultate nepublicate). Nu au fost detectate erori de mapare atunci când hărțile derivate din secvență au fost comparate cu hărțile MCD. Nu numai că fragmentele au fost ordonate corect, dar precizia distanțelor intersite a fost mai mică de 1%, deși cu o eroare sistematică ceva mai mare de 1% pentru fragmentele mai mari., Hărțile implicate în acest test conțineau mai mult de 700 de fragmente de restricție diferite. Într-un mod independent MCD cartografiere/pusca de secvențiere proiect de dimensiuni comparabile în HLA clasa I regiunea cromozomului 6, rezultate similare au fost obținute (D. E. Geraghty, T. Guillaudeux, și M. Janer, rezultate nepublicate). În HLA proiect, o singură eroare de mapare a fost detectat la sfârșitul de o hartă, care a fost trasată la miscounting de 600 bp multiplet bandă într-un singur cosmid. Hărți actualizate, secvențe și documentație software pot fi găsite pe site-ul nostru la http://www.genome.washington.edu.

Leave a Comment