Ugrás a tartalomhoz

Genetika és genomika

Falus András, László Valéria, Tóth Sára, Oberfrank Ferenc, Pap Erna, Dr. Szalai Csaba (2014)

Typotex Kiadó

„Junk DNS” a humán genomban

„Junk DNS” a humán genomban

Az alacsony génszám még a szakembereket is meglepte, sőt szinte sokként érte. Erre jellemző, hogy még 2000-ben a Cold Spring Harbor Laboratory Genome Meetingen a terület specialistái fogadtak a humán genom génszámára. A számok 26 ezer és több mint 150 ezer között terjedtek, így végül a legalacsonyabb számot tippelő nyerte a fogadást, pedig még ő is kb. 20%-kal magasabb számot tippelt a valóságosnál. Az eredmény azért is meglepte a szakembereket, mert például az alig 1 mm nagyságú, szabad szemmel gyakorlatilag láthatatlan, igen egyszerű felépítésű Caenorhabditis elegans nevű fonálféreg, amely az egyik legnépszerűbb modellállat genetikai vizsgálatokban, nagyságrendileg hasonló számú gént tartalmaz. Ebből az alacsony génszámból következik, hogy a humán genom fehérjét kódoló részének aránya mindössze 1,2%-a a teljes genomnak. Mivel korábban úgy gondolták, hogy a genom fő feladata az, hogy fehérjéket kódoljon, a fehérjét nem kódoló részt a genom hulladékának, angolul „junk”-nak nevezték [8.18]. A szakemberek azonban nyilvánvalóan érezték, hogy az emberi genom egyszerűen nem állhat 98,8%-ban szemétből, felesleges szekvenciából! Hogy tisztázzák ezt az ellentmondást, 2003-ban elindították az Encyclopedia of DNA elements (ENCODE) projektet: http://genome.ucsc.edu/ENCODE/, http://www.genome.gov/10005107, amely az első fázisban azt tűzte ki maga elé, hogy a genom 1%-ban felderíti az összes funkcionális egységet [8.19]. Ez a projekt 2007-ben lezárult, de 2008-ban 80 millió $-os költségvetéssel további 4 évre meghosszabbították.

2012 szeptemberében különböző jelentős újságokban 30 cikk jelent meg az eredményekről (http://www.nature.com/encode/#/threads). Eszerint a genomnak kb. 80%-ához tudtak valamilyen funkciót csatolni, és 75%-a át is íródik valamelyik sejtben. Röviden a következő funkcionális elemeket, tulajdonságokat lehetett megkülönböztetni:

  • Fehérjekódoló régiók

  • RNS-kódoló (fehérjére nem íródik át) régiók

  • Transzkripciós faktor kötőhelyek (kb. 70 000)

  • Enhancer régiók, távoli szabályozórégiók (kb. 400 000)

  • Távoli hatású kromatin-interakciók

  • DNS-metiláció

  • Hisztonmódosítás

A sok fontos eredményt itt mind nem lehet ismertetni, csak néhány érdekesebbet említek meg. Több vizsgálatban is DN-áz hiperérzékeny helyeket vizsgáltak (angolul: Deoxyribonuclease I (DNase I) hypersensitive site (DHS)). Ezekhez azért tud hozzáférni a DNS-t emésztő enzim, mert a DNS-kötő fehérjék a nukleoszómákat elmozdítják. Néhány erős kötődésű transzkripciós faktor kötődése „helyet csinál” a gyengébb kötődésű (alacsony affinitású) transzkripciós faktoroknak, ami lehetővé teszi a transzkripciót. Az eredmények alapján a transzkripciós faktorok kötődése gátolja a DNS-metilációt, és nem fordítva, ami nagy jelentőségű az epigenetikai eredmények magyarázata szempontjából.

Az egyik vizsgálatban DN-áz I enzim segítségével 125 sejtvonalat hasonlítottak össze. 2,9 millió DN-áz hiperérzékeny helyet detektáltak összesen, amelynek durván 1/3-a csak egyetlen sejttípusban volt megtalálható, és csak 3700 volt megtalálható mindegyik sejttípusban. Ezek az eredmények mutatják, hogy milyen óriási különbségeket lehet találni abban, hogy az egyes sejtekben hogyan szabályozódik a genom működése.

Egyetlen sejtvonalban (K562), 127 417 promóterközpontú kromatin-kölcsönhatást detektáltak, amelynek 98% intra-kromoszomális volt (géncsóknak (gene kissing) is nevezik). A gének 90%-ánál multigén-interakciót lehet tapasztalni, amely több megabázisig nyúlhat, számos promóter-promóter és promóter-enhancer kölcsönhatást magában foglalva. Ezeknek a kölcsönhatásoknak jelentős része sejtspecifikus.

Az eredmények azt is mutatják, hogy a betegségekhez kapcsolt, nem kódoló régiókban található helyek közül számos valamilyen funkcionális (szabályozó) régióban van. De a funkció szempontjából a sejttípus fontos! Ki lehetett mutatni, hogy az egyes betegség-specifikus variációknak csak bizonyos sejtekben van funkciója. Az ENCODE projekt által feltárt új funkcionális régiók így lehetőséget nyújtanak, hogy az egyes betegségekben detektált, eddig ismeretlen funkciójú régiókhoz sejtspecifikus tulajdonságokat rendeljünk, megértve így szerepüket a betegségben.

A genom 3 dimenziós szerkezetének és kromatinstruktúrájának is fontos jelentősége van. Ez utóbbira is történtek vizsgálatok. Eszerint, ha olyan algoritmussal hasonlították össze a különböző fajok genomját, hogy az azokat alkotó nukleinsavak milyen 3D-szerkezetet vesznek fel, akkor a humán genom 12%-át találták konzerváltnak [8.20]. Egyes elméletek szerint, építőipari hasonlatot használva, a genomban kódolt fehérjéket nevezhetjük építőköveknek, míg az azon kívüli részek tartalmazzák azt az információt, hogy ezeket a köveket hogyan kell úgy összerakni, hogy azokból egy működőképes szervezet jöjjön létre. Erre egyfajta bizonyíték az is, hogy bár az élet már 4 milliárd évvel ezelőtt kialakult a Földön, a többsejtű élőlények mindössze 525 millió évvel ezelőtt jelentek meg. Valószínűnek tűnik, hogy ez a 3,5 milliárd éves evolúció kellett ahhoz, hogy egy olyan szabályozó mechanizmus alakuljon ki, amely lehetővé tette a bonyolultabb életformák létrejöttét. Nyilvánvaló, hogy a szabályozáshoz szükséges információ nem a fehérjéket kódoló génekben található, azaz elvileg minél több ilyen szekvencia van egy genomban, annál több szabályozómechanizmus „férhet bele” [8.18].

Az alacsony génszám–bonyolult szervezet ellentmondást némileg feloldja az a felfedezés is, hogy génjeink 94%-a nemcsak egy fehérjét kódol, azaz például alternatív splicing útján a különböző szövetekben ugyanabból a génből más-más szerkezetű és funkciójú fehérjék íródnak át. Egyszerűbb szervezeteknél ilyen mechanizmus nincs, vagy csak jóval kisebb mértékű. Továbbá a fehérjék poszttranszlációs módosításaival rengeteg különböző fehérje jöhet létre. Egyes becslések szerint az ember fehérjéinek száma eléri a 2 milliót.

2001-ben még úgy gondolták, hogy a genom fő funkcionális részei a fehérjéket kódoló gének. Az RNS-eket egyfajta segédszereplőknek gondolták, azaz fő funkciójuk, hogy (mRNS, t-RNS, rRNS formában) a fehérjére való átíródásban segédkezzenek. Azonban az utóbbi években egyre másra fedezik fel, hogy az RNS-eknek milyen funkcióik vannak még, főleg a szabályozásban. A leghíresebb példa az RNS-interferencia és a mikro-RNS-ek (miRNS) felfedezése, amelyért 2006-ban Nobel-díjat is adtak [21]. Kiderült, hogy a gének > 60%-ának a szabályozásában játszanak szerepet, egy miRNS akár több száz génében is, lehetővé téve egy igen bonyolult, összehangolt szabályozást. De ide tartoznak a főleg a spermatogenezis szabályozásában, a transzpozonok elleni védelemben szerepet játszó piwi-interacting (pi) RNS-ek, vagy a pszeudégenről átíródó competitive endogenous RNS-ek (ceRNS), vagy antisense termini-associated short RNS-ek (aTASRs), Large intervening noncoding RNS (lincRNS) stb. [8.22]. Általában ezek fő szerepe a transzkripción, ritkábban a transzláción keresztüli géncsendesítés.

Az ENCODE projekt azonosított 8800 kis RNS-t, 9600 hosszú, nem-kódoló RNS-t (long noncoding RNA), amelyek mind legalább 200 bp hosszúak. Azt figyelték meg, hogy ezek az RNS-ek meghatározott sejtkompartmenekbe „mennek”, mintha meghatározott címük lenne. Van, amelyik a sejtmagba, van, amelyik a nukleoluszba, van, amelyik a citoplazmába. Ez arra utal, hogy szerepük a szabályozásban igen szofisztikált lehet.