Multiple-complete-digest restriction fragment mapping: Generating sequence-ready maps for large-scale DNA sequencing (Magyar)

RESULTS

a kísérleti eljárások mögött MCD mapping ábrán látható. 1. ábra, ennek a folyamatnak a fogalmi áttekintése pedig az ábrán látható. 2. Szabványos molekuláris biológiai protokollokat alkalmaznak az egész. Számos kiigazítást végeztek azonban az MCD feltérképezéséhez megfelelő minőségű adatok előállítására., A nagyon jó minőségű gélképek azért nélkülözhetetlenek, mert a fragmentumméret-mérések pontossága határozza meg az ujjlenyomat-adatok információtartalmát, így azt a gyakoriságot, amelynél a hasonló méretű különböző fragmentumokat összekeverik egymással. Ezenkívül a nagyméretű leképezés csak akkor praktikus, ha a gélképeket kevés hibával automatikusan lehet elemezni. Ez a cél csak következetes, kiváló minőségű képekkel érhető el.

iv xmlns: xhtml=”http://www.w3.org/1999/xhtml”> 1.ábra

a YAC → cosmid and BAC → cosmid MCD mapping nedves pad eljárásainak folyamatábrája., A fő különbség az, hogy míg a BAC DNS könnyen tisztítható a bakteriális kromoszómális DNS-ből, nincs jó preparatív módszer a YAC DNS elválasztására az élesztő kromoszómális DNS-től. A YAC esetben a YAC-ból származó kozmidek néhány százalékát hibridizációs alapú kolónia-szűrési protokoll azonosítja. A BAC-származtatott cosmids, ez a lépés felesleges, mert a leképező szoftver könnyen megszünteti a kis számú cosmids, amelyek nem származnak a BAC.

2.ábra

az MCD leképezési folyamat vázlatos ábrázolása., a) gél kép. b) az egyes klón egyes enzimtartományainak fragmentumméreteinek listája. A számmal jelölt sávok a klónt c01 vagy C02 néven azonosítják. Az M betűvel jelölt sávok azonosítják a méretjelzőket. C) három egyenzimes térkép egymástól függetlenül készül (jobbra). Az enzimtartományok közötti szinkronizálás összetett térképet eredményez (balra). A hosszú kullancsjelek a fragmensek rendezett csoportjai közötti határokat jelzik; a rövid jelölések a csoporton belül rendezetlen töredékeket jelölnek, önkényesen rajzolva csökkenő méret szerint.,

az MCD leképezés sikeres megvalósítása szükségessé tette a kísérleti folyamat és az adatelemző szoftver együttes fejlesztését. Ennek az interakciónak az egyik példája a kozmid vektor kialakítása. A shotgun szekvenáláshoz a vektornak a lehető legkisebbnek kell lennie, hogy minimalizálja a vektor ismételt szekvenálásához kapcsolódó felső értéket. Az MCD leképezésnél a vektor nem tartalmazhat a leképező enzimek helyét, és nem teszi lehetővé a vektor-beszúrás csomóponton egy mesterséges hely létrehozását (pl.,, ha egy MboI részleges emésztésű fragmentumot egy BamHI klónozási helyre kötnek, akkor esély van arra, hogy egy mesterséges BamHI webhely jön létre a csomóponton). Amikor az S-Cos-DBI vektort az MboI részleges emésztésű fragmensek klónozására használják, egy ismert minimális méretű (3205 bp) vektort tartalmazó fragmentumot állítunk elő mindhárom enzimdomainünkben. Mert ez a vektor-tartalmazó töredék nem képviselője sem teljes-digest részlet a mögöttes genom, ez által azonosított gél-át hibridizáció, majd kiesett a listáról töredékek használt térkép közgyűlés.,

A jelentős javulás a képminőség volt elérni váltás a intercalating festék SYBR green I. a gerjesztési hullámhossz a 488 nm használják a gél szkenner, úgy találjuk, hogy a SYBR green i ötször érzékenyebb, mint a tiazol narancs, ami viszont háromszor érzékenyebbek, mint etídium-bromid. Általában csak 15 ng kozmid DNS-t töltünk be gél sávonként, amikor SYBR-green i-t használunk a szokásos méretű gélek festésére. A sáv torzulása a helyi túlterhelés miatt soha nem jelent problémát, mivel a legnagyobb sávok csak 5-10 ng DNS-t tartalmaznak., Továbbá, ha csak mérsékelt tisztaságú DNS-t alkalmazunk, mint mi, a restrikciós emésztések tisztasága fordítottan kapcsolódik a baktériumkultúra térfogatához, amelyből a DNS kivonódik. A SYBR-green i jelentősen csökkentette a rossz vagy sikertelen emésztés miatt használhatatlan gélsávok számát. Az egyetlen komoly komplikáció az, hogy ismeretlen okokból a SYBR-green i egy szűk és változó tartományt jelenít meg, amely felett az integrált fluoreszcencia lineárisan növekszik a sávban lévő DNS mennyiségével.,

A fragmentumméretek automatikus, robusztus és pontos meghatározása gondosan megtervezett DNS-méretjelölőket igényel. Ideális esetben a jelölő sávokat egyenletesen kell elosztani a méretmobilitási görbe ívhossza mentén. Növekvő számú jelölő sávnak kell lennie, mivel a töredékméret megközelíti azt a küszöbértéket, amelyen a mobilitások méretfüggetlenné válnak. Figyelem a görbe-illeszkedő stabilitás ebben a régióban lehetővé teszi a kiváló fragmentum méretezési pontosság akár 15 kbp (SD ± 1%) és megfelelő fragmentum méretezési pontosság akár 40 kbp (SD ± 5%)., A második követelmény az, hogy három sávnak kell lennie, amelyek könnyen felismerhetők helyi intenzitású maximaként. Ezeknek a szembetűnő sávoknak a felismerése nukleálja az automatikus mintaegyezési eljárást, amellyel a képelemző szoftver azonosítja a jelölő sávokat. A mi szabványos gél formátumban (ábra. 3), a hat digest sávból álló készleteket két marker sáv szegélyezi. Mind az öt marker sávok a gél használják a kétdimenziós interpolációs algoritmus, amely hozzárendeli méretek a digest sávok.

3. ábra

szürke skála kép egy tipikus leképezési gélről, amelyet SYBR–green i-vel posztstaináltak., Az 1-es, a 8-as, a 15-ös, a 22-es és a 29-es pozíciónál öt jelzőlámpa van. Az EcoRI, HindIII és NsiI (és ebben a sorrendben betöltött) két klónt helyeznek el az egyes jelölő sávok között.

A kép elemzése probléma társul korlátozás digest minta egészen más, mint a “bázis” probléma társul egy sorozatot, hogy a létra. A Base calling szoftvernek csak a domináns sáv azonosítására van szüksége minden létrapozícióban., Ezzel szemben a korlátozási minták elemzésére tervezett szoftvernek meg kell határoznia az egyes sávokban lévő töredékek számát, mivel bármely hasonló méretű fragmentum bármelyik sávban megjelenhet. Normál elektroforetikus körülmények között két vagy három sáv multiplikációja gyakori. A sáv multiplikációkat annak ellenére kell kiszámítani, hogy a jel-zaj arányok kis fragmentumméreteknél csökkennek, és a nemlinearitások az integrált fluoreszcencia intenzitás és a DNS-mennyiség sávonként viszonyban vannak. Ezek a képjellemzők sávonként is változhatnak ugyanazon a gélen., A hatékony képelemző szoftvernek figyelembe kell vennie az összes ilyen kísérleti valóságot. Az elemzés egy tipikus gél sáv látható ábra. 4. Most sikeresen elemeztük több mint 1000 gélt a szoftverünkkel, és összességében majdnem olyan jó, mint egy szakértő tolmács. Olyan hibákat követ el, amelyeket egy emberi szakértő nem tenne meg, de helyesen elemzi azokat a sávokat is, amelyeket egy szakértő elszámolna.

4. ábra

agaróz gél képek feldolgozása. (a) hamis színű kép digest lane 11 a gél ábrán látható. 3., A teljes sávos kép látható (balra), a “zoom” által körülhatárolt régió intenzitás-átméretezett képe pedig (jobbra) látható. A fehér sávok olyan sávokra mutatnak, amelyeket a képelemző szoftver automatikusan azonosít. Az alappárok fragmentumméretei jelennek meg, zárójelben pedig az egynél nagyobb sávszaporodásokat adjuk meg. b) A teljes sáv (felső) és a nagyítási régió (alsó) egydimenziós ábrázolása. Az egyik dimenzió összeomlása medián elfogult átlagolási sémával történik. Minden sort külön elemezzük., A képpontok először intenzitás szerint vannak rendezve, a legkisebb intenzitású pixelek rögzített száma pedig megszűnik, hogy figyelembe vegye a gélsávok közötti rést. A fennmaradó részből kiszámítják a középső kvartilis átlagát. C) töredék számít a sáv, amely nyolc singlets, három doublets, és egy triplett. Fragmentum száma becslések alapján a trend az integrált sáv intenzitása versus fragmentum mérete. Ez a tendencia a géltől a gélig változó, és erősen nemlineáris., A gélen lévő összes digest sávot, amelyet a rossz adatok miatt nem utasítottak el, egyidejűleg elemezzük, hogy összetett trendvonalat építsünk az integrált intenzitás és a DNS-mennyiség közötti kapcsolatra.

a rendszer egyik legfontosabb jellemzője az alacsony minőségű adatok automatikus elutasítása. Nincs kísérlet a probléma forrásának azonosítására. A szoftvernek van egy belső modellje arról, hogy egy jó adatsávnak hogyan kell kinéznie, és elutasít minden olyan sávot, amely nem felel meg ennek a modellnek., Az észlelt problémák típusainak részleges listája magában foglalja a törölt klónokat, a vegyes klónokat, a részleges emésztést, a sikertelen emésztést, a másodlagos helyeken történő hasítást, a túlterhelt sávokat, az alulterhelt sávokat, valamint a gélen lévő szennyeződéseket. A jelenlegi gyakorlatban a gélsávok 80-90% – a használható. Azonban még a jó sávok is félreértelmezhetők. Egy hatékony eszköz kimutatására félreértelmezések a kereszt enzim sum-of-fragmens konzisztencia teszt., Kivéve hozzájárulások néhány hiányzó kis töredékek mérete kisebb, mint 500 bp, amelyek átlagosan várhatóan kevesebb, mint 1% – a A teljes cosmid hossza, az összeg töredékek összhangban kell lennie az enzim domének. Ez változhat 40-50 kbp klónról klónra, de enzimről enzimre egy adott klón teljes eltérések több mint 1 vagy 2 kbp szinte biztos jele annak, hogy valami baj van a képelemzés., Ha ezt a tesztet használjuk a helytelen sávok észlelésére, és manuálisan korrigáljuk a töredékszámokat, lényegében megszüntettük a fragmentum elszámolását minden 2 kbp-nél nagyobb sávon.

az MCD map assembly automatikus fázisa olyan lépéssorozatként folytatódik, amelynek során a klón végeinek sorrendje és a korlátozási töredékek fokozatosan finomodnak (16, 17). Fragmentum méretezés kiugró kezeli a “szürke zóna” koncepció. A fragmentum párosítás, amely pontosabb, mint az alsó szürke zóna küszöb automatikusan elfogadja, kivéve, ha sérti a topológiai kényszer a térkép., A szürke zónán belül a fragmentumok csak akkor készülnek, ha a topológiai konzisztenciához szükségesek; ellenkező esetben elhalasztják őket. A felső szürke zóna küszöbénél kevésbé pontos párosításokat egyenesen elutasítják. Jelenleg a szürke zóna küszöbértékeit 2,0-4,0% – ra állítjuk be a legtöbb használható mérettartományban. Ezek a küszöbértékek mind a nagy fragmensek esetében (az elektroforetikus felbontás súlyos elvesztése miatt), mind a kis fragmensek esetében (az elektroforetikus felbontás mérsékelt elvesztése és a megnövekedett sáv szélesítése miatt) növekednek., A statisztikai kiugró értékek általában a szürke zóna alá esnek. Az érvényes párosítások a szürke zónában végződnek, elsősorban egy multiplet sáv eredményeként, amelyet a képelemző szoftver nem megfelelően bomlik le komponens töredékeire.

végül a pontos térképek megszerzésének kulcsa egy “fix it as you grow” stratégiában rejlik. Az alapfeltétel az, hogy a hibák ritkák, a bemeneti adatok magas minősége miatt., Amikor hibák fordulnak elő, és függetlenül attól, hogy azok aberrációk, képelemzési hibák vagy térkép-összeszerelési hibák klónozása miatt következnek be, a probléma általában csak a három enzimdomain egyikére korlátozódik. Gyakran a probléma egyetlen klónra korlátozódik. A gyanúsított klón eltávolítása lehetővé teszi a térkép növekedését. Miután a térkép túlnyúlik a gyanúsított klón végén, általában meglehetősen könnyű meghatározni, hogy miért zavarta meg ez a klón eredetileg a térkép növekedését., Ha a probléma nyilvánvaló hiba a képelemzésben vagy a vektorsávos azonosításban, akkor az adatkészletet rögzítjük, majd a klónt visszahelyezzük a térképbe. Nagy mintavételi mélységeinkben a térképszerkezet ezen korlátai mindenhol elég erősek, de a végükön szinte minden hiba észlelését és kijavítását lehetővé teszik. Minden észrevétlen hiba vagy a térkép végének klónhosszán belül van, vagy kivételesen alacsony lefedettségű régióban.

az 1. táblázat a YAC → cosmid térképek összefoglalása, amelyeket az emberi 7.kromoszómára építettünk., Nem minden töredék rendezett, helyileg rendezetlen fragmensek kerülnek ” fragmentum csoportok.”A legtöbb esetben átlagosan 1,2–1,3 rendezetlen fragmentum van töredékcsoportonként, ami azt jelenti, hogy szorosan közelítjük meg az összes korlátozási fragmentum megrendelésének célját. Egy tipikus MCD térkép, amely egyesíti az eredményeket négy önállóan épített YAC → cosmid térképek, ábrán látható. 5. A nagy mintavételi mélységek lehetővé teszik egy valóban minimális csempézési út kiválasztását, csak néhány kilobázispár átfedésével., A YAC fidelity-t úgy érvényesítik, hogy összehasonlítják a egymástól függetlenül felépített térképek közötti átfedő régiókat. A mai napig nem találtak eltéréseket. A YAC fidelity még szigorúbb tesztjeként ujjlenyomatot vettünk egy kis kozmidgyűjteményből egy könyvtárból, amelyet közvetlenül alcsoportosítottak ugyanabból a hibrid cellavonalból, amelyet az YAC-K felépítéséhez használtak (E. D. Green, kiadatlan eredmények). Nem találtak eltérést a kozmidák és a YAC klónokból származók között. A YAC instabilitásával kapcsolatos népszerű felfogások nagyrészt a viszonylag kis számú könyvtárral kapcsolatos tapasztalatokon alapulnak., Ezek az eredmények azt mutatják, hogy stabil YAC könyvtárak építhetők, és hogy az YAC-k felhasználhatók kiindulási klónokként a szisztematikus szekvenáláshoz.

Nézet ez a táblázat:

  • Nézet inline
  • Nézet popup
1. Táblázat

Összefoglalása ÖSSZEFOGLALVA → cosmid MCD térképek részeit emberi kromoszóma 7

Ábra 5

Képviselője MCD-térkép kromoszóma 7. Négy hibrid sejtvonalból származó YAC-t csoportosítottak kozmidákba, hogy feltérképezzék ezt a 400 kbp-os régiót., Ezenkívül egy speciális cosmid könyvtárat is elhelyeztek ezen a térképen, amely közvetlenül a hibrid sejtvonalból származik (azaz nem egy YAC klónból származik), ellentmondások nélkül. A térképet közvetlenül a felső skála sáv alatt ábrázolják. Az enzimdomaineket EcoRI, HindIII és NsiI ábrázolják, felülről lefelé, piros, zöld és kék színben. A rendezett fragmentumcsoportokat magas kullancsjelek választják el egymástól, a csoporton belüli rendezetlen fragmentumokat pedig rövid kullancsjelek választják el egymástól. A minimális csempézési útvonalú klónok lila színben jelennek meg a térkép alatt., A csempézési útvonal klónok alatt egy nagyobb klónkészlet jelenik meg: ez a készlet tartalmazza az összes klónt, kivéve azokat, amelyek töredék tartalma megegyezik, vagy egy részhalmaza, egy megjelenített klón. Következő egy öt hisztogram sorozat. Felülről lefelé a következő forrásokból származó kozmid lefedettséget tükrözik: a cosmid könyvtár közvetlenül a hibrid sejtvonal DNS-éből, az yWSS1613-ból, az yWSS771-ből, az yWSS1572-ből és az yWSS1434-ből készült. A hisztogramok alatt egy atlaszon alapuló térképminőség-értékelés (E. Thayer, kiadatlan munka).,

most a DNS közel 1 Mbp-jéből szekvenáltuk a kozmideket, amelyek leképezését az 1.táblázat foglalja össze. A shotgun szekvenálási adatokat a Phred/Phrap szekvencia-összeszerelő rendszerrel (P. Green, nem publikált eredmények) elemeztük. Nem térképezési hibákat észleltek, amikor a szekvencia származtatott térképeket összehasonlították az MCD térképekkel. Nem csak a fragmentumokat helyesen rendelték meg, hanem az intersite távolságok pontossága kevesebb volt, mint 1%, bár a nagyobb fragmensek esetében a szisztematikus hiba valamivel több, mint 1% volt., A tesztben részt vevő térképek több mint 700 különböző korlátozási töredéket tartalmaztak. Egy független MCD leképezés / shotgun szekvenálás projekt hasonló méretű a HLA osztály i régió humán kromoszóma 6 hasonló eredményeket kaptunk (D. E. Geraghty, T. Guillaudeux, M. Janer, kiadatlan eredmények). A HLA projektben egy térkép végén egyetlen leképezési hibát észleltek, amely egy 600 bp multiplet sáv elszámolására vezethető vissza egyetlen kozmidben. Naprakész térképek, szekvenciák és szoftverdokumentációk találhatók weboldalunkon a http://www.genome.washington.educímen.

Leave a Comment