Ugrás a tartalomhoz

Genetika és genomika

Falus András, László Valéria, Tóth Sára, Oberfrank Ferenc, Pap Erna, Dr. Szalai Csaba (2014)

Typotex Kiadó

A HGP néhány eredménye

A HGP néhány eredménye

Az emberi genom szekvenálása számos érdekes, sokszor váratlan eredményt hozott, amelyeket a tudományos világ azóta is folyamatosan frissít, illetve bővít. Talán a legmeglepőbb eredmény az volt, hogy a várt, 100 ezres nagyságrendű génszám helyett alig több mint 20 ezer gént tartalmaz a humán genom. Az 8.1. táblázatban látható néhány statisztikai adat a humán genomról.

8.1. táblázat - Néhány statisztikai adat a humán genomról. Forrás: http://www.ensembl.org/Homo_sapiens/Info/StatsTable

Legutolsó frissítés 2012. július
Genom nagysága (bázispár) 3 300 551 249
Ismert fehérjét kódoló gén (darab) 20 476
Pszeudogén (darab) 13 322
Nem-kódoló gén (darab) 22 170
Gén exon (darab) 700 947
Rövid variánsok, pl. SNP (darab) 54 418 495
Szerkezeti variáns 9 235 137

Néhány érdekesebb eredmény az alábbiakban láthatók, kiegészítve/kijavítva újabb eredményekkel, pl. az 1000 genom projektből:

  • Legnagyobb gén: DMD, mely a Dystrophint kódolja: 2,2 Mb (2 221 182 bp)

  • Leghosszabb kódolószekvencia: titin: 104 076bp, < 34 500 aminosav)

  • Leghosszabb exon: titin: 17 106 bp

  • Legtöbb exon titin gén: 351 db

  • 20%-a a genomnak (605 Mb) génsivatag = >500 kb. gén nélkül

  • Géngazdag kromoszómák: 17 19 22

  • Leggazdagabb: 19-es: 59,1 Mb = 1484 gén (Ensembl): 25,01 gén/Mb

  • Génszegény kromoszómák: 4,13,18,X,Y

  • Y a leggénszegényebb összesen 72 gén; ~1,2 gén/Mb

  • Az intronoknak a 98,12% GT-bázisok vannak az 5’ végén és AG 3’ végén; 0,76% GC-AG

  • A rekombináció magasabb a nőkben, mint a férfiakban, de a mutációk száma magasabb a férfimeiózisban, azaz az emberekben található öröklődő mutációk többsége a férfiakban keletkezik.

  • Minden újszülött 60 új mutációt kap szüleitől.

  • Minden ember átlagosan 250-300 funkcióvesztése mutációval rendelkezik az ismert (annotált) génekben, melyek közül 50–100 olyan gén, amely valamilyen öröklődő betegségben szerepet játszik. Ez többek között jelzi, hogy miért veszélyes, ha egymással rokonságban élő párnak gyermeke születik. Ilyenkor nagy az esély arra, hogy a szülőpárban heterozigóta formában jelen lévő, recesszív betegség a gyermekekben megjelenjen. Illetve, a funkcióvesztéses mutációnál, mivel egyes létfontosságú fehérjék kisebb mennyiségben vannak jelen, megnövelhet bizonyos betegségekre való hajlamot vagy legalábbis befolyásolja a hordozók fenotípusát. Érdekes megjegyezni azonban, hogy ennek ellentétes hatása is lehet, amit majd a gén-környezet kölcsönhatás részben tárgyalunk, azaz bizonyos környezeti tényezőkkel szemben (pl. fertőzés) növelheti az ellenálló képességet.

  • A humán genom 46%-a ismétlődő szekvenciákból áll. Ezek közül sok a transzpozon, azaz ugráló gén, amelyek viszont kb. 40 millió év óta inaktívak. A leggyakoribb ismétlődő szekvenciát Alu-nak hívják, mely a teljes genomunk 10,6%-át foglalja el.

  • Több száz génünk származik baktériumokból, horizontális géntranszferből.

  • A pericentromerikus és a subtelomerikus régiókban nagy szakaszok ismétlődnek.

  • Jelenleg 156 imprintált gént (Genetikai imprinting: az apai és az anyai gének kifejeződése különböző) ismerünk, azaz ezek közül vagy csak az anyai (56%), vagy csak az apai (44%) aktív. Ha valami oknál fogva ebben a rendszerben hiba következik be, tehát pl. ha mindkét gén aktív, súlyos betegségekhez vezet (pl. Beckwith–Wiedemann és Angelman-szindrómák). Ld.: http://www.geneimprint.com/site/genes-by-species.

  • CpG-szigetek olyan szekvenciák ahol a CG dinukleotid arány magasabb a vártnál. Ezekből 27 000–29 000 db található az ismétlődésmentes részeken; sokszor egybeesnek a gének 5’ végével (40%). A citozinon metilálódhatnak, amivel befolyásolhatják a gének expresszióját, szerepet játszanak a gén inaktivációjában és az imprintingben. Általában a promóter régió metilációja a transzkripciós aktivitás csökkenését, a kódoló régió metilációja a növelését okozza. A metilációs mintázat erősen sejtspecifikus. Az őssejteken a metiláció 25%-a nem CG-n történik, hanem CA-n (szemben a normál sejtekkel, ahol ez az arány csak 1%).

  • A génexpresszió szabályozásában fontos szerepet játszanak a nukleinsavak és a hisztonok metilációja és egyéb módosításai. Ennek tanulmányozására indították el a Human Epigenome Projectet[8.8], [8.9]. Ebből egy új tudományág nőtt ki, az epigenomika, amely a genom, illetve a genom mellett található fehérjék olyan módosulataival foglalkozik (pl. metiláció, acetiláció, hisztonmódosulások), amelyek nem érintik közvetlenül a DNS-szekvenciát, a bázissorrendet, de működésében fontos szerepet játszanak, sőt tovább is örökíthetőek. A metilációs mintázat hibái is vezethetnek betegségekhez. Ide tartoznak az imprintált géneknél említett szindrómák (az imprintáltság is a metiláció révén szabályozott), vagy pl. egyes tumorok, fragilis X-vagy a Rett-szindróma (részletesebben ld. 4. fejezet).

  • A génexpresszió szabályozásában a promóter régiók mellett, amelyek a transzkripciós starthely közelében helyezkednek el, távoli régiók is részt vesznek. A genomban átlagosan 3,9 távoli régió kölcsönhatást detektáltak transzkripciós starthelyenként.

  • Az AT-gazdag régiók génszegények.

  • Detektáltak 298 db paralógot, egy exonos gént (processed paralog), ebből 97 igazoltan működik. Paralóg = génduplikáció eredménye, működnek, intronos vagy intron nélküli változat, funkciója lehet ugyanaz vagy hasonló, de más is, mint az eredeti génnek (vs. ortológ). Mivel a szelekciós nyomás a duplikálódott génen kisebb vagy hiányozhat, szabadon mutálódhat, így nyerve új funkciókat.

  • Eddig (2012. október) 13 322 pszeudogént találtak. Ezek, szemben a paralogokkal, inaktív gének: lehetnek nem expresszálódó másolatok: processed (intron nélküli), unprocessed duplicated (intronos) változata az eredeti génnek; de átíródhatnak RNS-sé is. Korábban semmilyen szerepet nem tulajdonítottak nekik, azonban újabb kutatások alapján, az átíródó pszeudogének befolyásolhatják a velük rokon gének működését, pl. úgy, hogy kompetícióba kerülhetnek a génexpresszió-szabályozásban fontos szerepet betöltő miRNS-ekkel vagy expressziójukkal csökkenthetik a funkcionális gén stabilitását. Becslések alapján a pszeudogének 9%-a íródik át.

A humán és más élőlényének genomjáról számos weboldalon gyűjthetünk információkat, pl.: http://genome.ucsc.edu/; http://www.ensembl.org/; http://www.ncbi.nlm.nih.gov/.

A genetikai variációkkal, témánkban betöltött jelentős szerepük miatt, a következő alfejezetben foglalkozom.

A humán genom feltérképezése a HGP hivatalos lezárása után sem fejeződött be. Megalakult a Genome Reference Consortium, amelynek fő feladata, hogy a genomban még megtalálható hiányokat ("gap"-ek) feltérképezze, illetve az esetleges hibákat korrigálja. A gap-ek a genom nehezen megszekvenálható, főleg ismétlődéseket tartalmazó régióiban találhatók. Becslések szerint a HGP befejezésekor 350 ilyen gap volt, a szerkezei variációk egy része ezekben a gap-ekben található. Ez a régió nem kicsi, a teljes genom kb. 5%-ának felel meg. A feladat nehézségére jellemző, hogy 6 évvel később, 2009-ben még csak 50 ilyen gap-et sikerült megszekvenálni.