Ugrás a tartalomhoz

Genetika és genomika

Falus András, László Valéria, Tóth Sára, Oberfrank Ferenc, Pap Erna, Dr. Szalai Csaba (2014)

Typotex Kiadó

A humán genom variációi

A humán genom variációi

Az emberi genom megismerését célzó Human Genome Project (HGP) része volt a humán genom variációinak a vizsgálata is, ami témánk szempontjából olyan nagy jelentőségű, hogy lényegét külön ismertetem [8.2], [8.3].

A genom leggyakoribb variációja az egy nukleotidot érintő polimorfizmus, angol rövidítéssel SNP (single nucleotide polymorphism). Általában SNP-ről beszélünk akkor, ha a variáció populációs gyakorisága meghaladja az 1%-ot. Az ennél kisebb gyakoriságban előforduló variációt általában mutációnak szoktuk nevezni, bár ez utóbbi kifejezést főleg akkor használjuk, ha a variációnak fenotípusosan is megjelenő, funkciót módosító hatása is van. Azonban az elmúlt időben, az SNP-k meghatározása óriásit változott (ld. módszerek), és SNP-nek neveznek általában mindenféle, egy nukleotidot érintő variációt, azzal hogy hozzáteszik, hogy mekkora a ritka allél gyakorisága, azaz a MAF-ja (minor allele frequency). Ennek a pontos definícióját még nem adták meg, de általában gyakorinak mondják, ha a MAF > 5%, alacsonynak, ha a MAF 0,5–5% között van, és ritkának ha < 0,5%, néhány publikációban ez utóbbi 0,3%.

Relatíve a legtöbb SNP az intronokban található, utánuk következnek az intragenikus régiók, és végül legritkább az SNP az exonokban. Általában, átlagosan minden 1000 nukleotid polimorf, viszont az összes SNP-nek csak kb. 0,1%-a változtat meg aminosavkódot, és ennek is csak kb. 40%-a non-konzervatív. A többi SNP első ránézésre semleges, azonban a legújabb vizsgálatok rámutatnak arra, hogy fenotípusos megjelenés szempontjából (ide tartozik pl. a betegségekre való hajlam, környezeti tényezőkre, gyógyszerekre való reagálás is) nem meghatározó, hogy az illető SNP változtat-e meg aminosavkódot vagy nem. Sőt az utóbbi időkben felfedezett betegségekhez kapcsolható SNP-k túlnyomó többsége nem változtat meg aminosavkódot [8.4].

Már a HGP során is találtak nagyobb szekvenciavariációkat a genomban, azonban ezek jelentőségét populációs szinten, az SNP-kel összehasonlítva, elhanyagolhatónak mondták. Azonban 2006 végén, ahogy egyre javultak a genom vizsgálati módszerei, rájöttek, hogy a genomban rengeteg kisebb-nagyobb méretű kópiaszám-variáció fordul elő [8.10]. Azaz vannak olyan, 1000-től akár több megabázis nagyságú nukleotid szekvenciák, amelyek, ha a genomokat összehasonlítjuk, különböző kópiaszámban fordulnak elő. Ezekből ugyan nincs olyan sok, mint az SNP-kből, azonban mivel nagyobb genomterületeket érintenek, összességében két ember között nagyobb variációért felelnek, mint az SNP-k. Ezt a típusú variációt elnevezték copy number variation-nak, azaz CNV-nek [8.10]. Legtöbbször a genom szerkezeti variánsait általában a CNV-khez szokták sorolni. A 8.3. ábra mutatja be a lehetséges szerkezeti variánsokat.

8.3. ábra - A genomban előforduló szerkezeti variánsok

A genomban előforduló szerkezeti variánsok

Becslések szerint a teljes genom 12%-át érintik ezek a variációk, és eddig 2900 gént (a gének 13%-a) találtak, amely érintett. Ez azt jelenti, hogy egyes emberek különbözhetnek abban, hogy egy génből hány kópia található meg bennük. Az esetek többségében ez semmilyen látható tünetet nem okoz, de már számos betegségben igazolták a CNV-k szerepét. Ilyen pl. a skizofrénia, a HIV/AIDS hajlam, a Crohn-betegség, vesebetegségek, Alzheimer-kór vagy az obezitás. Az SNP mintájára, ahol a polimorfizmus szó arra utal, hogy a variáció gyakorisága nagyobb, mint 1%, bevezették a copy number polymorphism (CNP) kifejezést is a gyakori CNV-kre.

A betegségek mellett pl. a transzplantációban is szerepet játszhatnak a CNV-k. Például, vannak populációs szinten is gyakori, egész géneket érintő deléciók. Ilyenkor, ha a beültetést kapó szervezetből hiányzik egy gén, és így az abból expresszálódó fehérje, akkor, ha a donorszervben megtalálható ez a fehérje, az akceptor szervezet immunválaszt adhat a beültetett szerv ellen – az MHC-egyezés ellenére, pl. csontvelői őssejt átültetésénél „graft versus host betegség” léphet fel [8.11].

A CNV-kkel kapcsolatban még egy érdekes felfedezést tettek. Általánosan elfogadott, hogy az egypetéjű ikrek genetikailag teljesen egyformák. Ezt a dogmát változtathatja meg az a felfedezés, hogy különbséget találtak a CNV-k tekintetében egypetéjű ikrek között [8.12]. Ez utóbbi azt is mutatja, hogy szomatikusan is keletkezhetnek, pl. a magzati fejlődés során.

A CNV-k kimutatása szempontjából fontos, hogy a CNV-k egy részénél található olyan SNP, amely kapcsoltan öröklődik, azaz ezeknek a CNV-knek a kimutatásához elégséges a sokkal egyszerűbben (ld. módszerek fejezet) kimutatható SNP-ket detektálni.

A CNV-ket is figyelembe véve egy ember két genomja (itt a két szülőtől kapott kromoszómakészlete) átlagosan 0,5%-ban különbözik egymástól, azaz a CNV-k körülbelül 4x akkora különbségért felelnek, mint az SNP-k. Ezt az elsőnek megszekvenált ember, Craig Venter genomjából állapították meg ([8.13] 8.2. táblázat). Azonban a különbség történelmileg régen elvált embercsoportok között akár a 3%-ot is elérheti. Érdekesség, hogy ezek a különbségek egy része véletlenszerű mutációk révén alakult ki (és ún. random drift, azaz véletlen sodródás során halmozódhat fel lokálisan), másik részük kialakulásában viszont a természetes szelekció játszott szerepet. Ide tartoznak pl. a bőrszínt, vagy az immunválaszt befolyásoló (baktériumok, vírusok által formált) genetikai variációk, melyek egy részét már sikerült beazonosítani (ld. gén-környezet fejezet).

8.2. táblázat - Genetikai variációk aránya különböző megszekvenált humán genomokban [8.13]

SNP-k száma
J. Craig Venter genomja 3 213 401
James Watson genomja 3 322 093
Ázsiai genom 3 074 097
Yoruban (afrikai) genom 4 139 196
Szerkezeti variánsok Venter genomjában
Darab Hossz (bp)
CNV 62 8 855–1 925 949
Inzerció/deléció 851 575 1–82 711
Blokkszubsztitúció 53 823 2–206
Inverzió 90 7–670 345

A modern ember-genom fejlődéséről alkotott elképzelésünk jelentős változásokon ment keresztül az elmúlt években. 2010 májusában Scante Pääbo és munkatársai először a neandervölgyi ember, majd egy nemrégiben felfedezett emberpopuláció a denisovai (magyaros írással gyenyiszovai) ember genomját szekvenálta meg [8.14], [8.15]. Itt kell megjegyezni, hogy jelenleg még nem eldöntött kérdés, hogy ezek az embertől külön fajként definiálhatók-e, vagy ugyanazon faj egy alfajának? Korábban az elmélet az volt, hogy a modern emberek egy csoportja kb. 50 000 évvel ezelőtt elhagyta Afrikát, és benépesítette a Földet. Azonban ezekben a vizsgálatokban azt találták, hogy a modern ember a Közel-Keleten részben keveredett a neandervölgyi emberrel, illetve bizonyos embercsoportok a denisovai emberrel. Ennek következtében bizonyos ma élő embercsoportok 1–4%-ban a neandervölgyi, a pápua új-guineai és egyes szigeteken élők, ausztrál őslakosok, óceániaiak stb. pedig a denisovai ember genomjának 4–6%-át hordozzák. Pl. a melanézek, mindkét populációtól hordoznak genomnyomokat, genomjuk kb. 8%-ában. Ezek nyilván hozzájárulnak két ember genomja közötti különbségekhez [8.16], [8.17].

Érdekességként itt lehet megjegyezni, hogy egyes kutatások alapján ez a hozzákeveredés, vagy angolul admixture, pozitív hatással volt a ma élő ember immunrendszerére. Becslések szerint a ma élő ember HLA-alléljainak kb. 50%-a az archaikus emberektől származik, növelve ezzel a patogének felismerésében fontos szerepet betöltő HLA variációinak számát, így populációs szinten a faj stabilitását (ld. 11. és 12. fejezetek).

A HGP után a HapMap projektek és az 1000 genom projekt járultak hozzá jelentős mértékben az emberi genom variációinak feltérképezéséhez. Például a hét populációt vizsgáló 1000 genom projekt első eredményeit bemutató „pilot” cikkében 15 millió SNP-t, 1 millió rövid inzerciót vagy deléciót és 20 ezer szerkezeti variánst közöltek. Ezek többsége új variáció volt. Becslések szerint azonosították az ezekben a populációkban található összes variáció 95%-át [8.8].

A variációk és a gének száma szempontjából kiemelkedik az emberi genom 6p21.3 régiójában található MHC (vagy HLA) régió. Ezen a 7,6 Mb szakaszon kódolódnak az immunválaszban, transzplantációban, véradásnál létfontosságú szerepet betöltő MHC- vagy HLA-gének. Ennek a genomterületnek az ún. class III régiójában található a legnagyobb génsűrűség (58 expresszálódó gén), illetve az egész régióra jellemző a nagyfokú diverzitás. Egy vizsgálatban ennek egy 4 Mb-nyi régiójában 37 ezer SNP-t és 7 ezer szerkezeti variánst találtak, ami kb. egy nagyságrenddel nagyobb variációsűrűség, mint a genom többi részén.