Ugrás a tartalomhoz

Genetika és genomika

Falus András, László Valéria, Tóth Sára, Oberfrank Ferenc, Pap Erna, Dr. Szalai Csaba (2014)

Typotex Kiadó

DNS-szekvenálás

DNS-szekvenálás

A DNS-szekvenálás fejlődése a HGP befejezése óta is töretlen. A humán genom szekvenciáját a HGP-ben Sanger módszerével a didedoxi-szekvenálással határozták meg. A HGP összköltsége 3 milliárd $ volt, Craig Venter genomjának megszekvenálása összesen 70 millió $-ba került. 2001-ben egy humán genom megszekvenálása minimum egy évbe tellett. Nyilvánvaló, hogy ekkora költség és ennyi idő nem alkalmas arra, hogy a genomszekvenálás a mindennapi rutinná váljon, de még arra sem, hogy sok ember genomját megismerjük, összehasonlítsuk. Az is lassan világossá vált, hogy ennek a módszernek a továbbfejlesztésével nem lehet jelentősen csökkenteni a költségeket, illetve az időt. Azonban a szakértők számára nyilvánvaló volt, hogy ha olcsóvá és gyorssá lehetne tenni a szekvenálást, az óriási előrelépést jelentene például a gyógyszerkutatásban vagy a személyre szabott gyógyászatban, de a felhasználási lehetőségek száma szintén végtelen. Hogy a fejlesztéseket elősegítsék, létrehozták az Archon X-díjat a genomikáért (8.1. ábra) [8.5]. Ezt a díjat, 10 millió $-ral együtt, az a cég kapja, amelyik képes 100 emberi genomot, maximum 10 nap alatt, maximum 1 hibával 100 ezer bázisonként, és nem többért, mint 10 ezer $/genom költségért megszekvenálni. Ez a felhívás 2006-ban sokak számára még kicsit utópisztikus vágyálomnak tűnt, azonban hamarosan kiderült, hogy a célt valószínűleg hamarabb fogják elérni, mint ahogy azt sejtették. Abban mindenki egyetértett, hogy nem is a kitűzött 10 millió $ az igazi tét, hiszen, ha egy cég jelentős piaci előnyhöz jut ezen a piacon, az ennél nagyságrendekkel nagyobb hasznot fog elérni. Mindenesetre számos cég, illetve szervezet egymással párhuzamosan olyan radikálisan új fejlesztésekbe, újításokba fogott, hogy rövidesen többen is a cél közelébe kerültek. A didedoxi-szekvenálás helyett olyan módszereket fejlesztettek ki, mint pl. a szekvenálás ligálással (solid technológia, Applied Biosystem), a piroszekvenálás (454 technológia, Roche) vagy a szekvenálás reverzibilis terminátorral (Solexa technológia, Illumina). A módszerek annyira sikeresek voltak, hogy a szekvenálást 2007-ben megválasztották az év módszerének [8.6]. Az új módszerek közül először 2007-ben, a 454 technológiával, James Watson genomját szekvenálták meg 2 hónap alatt, 1 millió $-ért, ami még ugyan messze volt a kitűzött céltól, de máris óriási előrelépést jelentett a korábbiakhoz képest. Sőt az összes cég folyamatos fejlesztésben van, és egyre lejjebb szorítják mind az időt, mind a költségeket. Például az Applied Biosystem 2008-ban 6 ezer $-ért szekvenált meg egy genomot. 2011-ben az Illumina HiSeq 2000 rendszerével 30x-os lefedettséggel két emberi genom megszekvenálása 8 nap alatt történik, 6 ezer $ dollár/genom költséggel. A Complete Genomics nevű cég egy cikkében 40x-es lefedettséggel már 1500 $-ról írt. De a verseny tovább folyik, új technikákkal vagy a régiek tökéletesítésével szinte havonta jelennek meg újabb hírek a szekvenálás árának csökkenéséről és sebességének növekedéséről (8.2. ábra).

A szekvenálás fejlődését kihasználva olyan projektek indultak, mint pl. az 1000 genom projekt, amely különböző etnikumú populációkhoz tartozó, összesen 2500 ember megszekvenálását tervezi. A projekt 2008-ban indult, és első eredményeit már 2010 októberében közölték [8.7], [8.8]. De ilyen projektek például a Genome 10k projekt, amely 10 ezer gerinces faj megszekvenálását tervezi (http://genome10k.soe.ucsc.edu/), vagy a 2011 márciusában indult i5k projekt, amely 5000 rovar megszekvenálását tűzte ki célul http://www.arthropodgenomes.org/wiki/i5K).

8.1. ábra - A genomikai X-díj emblémája (5; 2013. február 13.)

A genomikai X-díj emblémája (5; 2013. február 13.)

8.2. ábra - DNS-szekvenálás árának (piros vonal) és az adatbázisokban tárolt befejezett DNS-szekvenciák mennyiségének (kék vonal) változása 2000 és 2010 között, logaritmikus skálán. 2000 környékén egy millió bázispár megszekvenálása 10 ezer $-ba került, amely 2010-re már 1 $-ra csökkent. A befejezett DNS-szekvencia mennyisége 2000-ben 8 milliárd bázispárral indult, és kb. minden 18. hónapban megduplázódott a mennyisége. 2010-re 270 milliárd bázispárra nőtt. Ez azonban eltörpül a nyers adatok mennyisége mellett, amelyet a Trace archive and Sequence Read Archive (SRA)-ban tárolnak. Az itt tárolt mennyiség 25 trillió bázispár volt 2010-ben, amit, ha ebben a koordináta-rendszerben akarnánk ábrázolni, 12 méterre lógna ki a könyvből, ami kétszerese egy átlag zsiráf magasságának. Az ábra a Nature 2010:464:671 cikk ábrája alapján készült

DNS-szekvenálás árának (piros vonal) és az adatbázisokban tárolt befejezett DNS-szekvenciák mennyiségének (kék vonal) változása 2000 és 2010 között, logaritmikus skálán. 2000 környékén egy millió bázispár megszekvenálása 10 ezer $-ba került, amely 2010-re már 1 $-ra csökkent. A befejezett DNS-szekvencia mennyisége 2000-ben 8 milliárd bázispárral indult, és kb. minden 18. hónapban megduplázódott a mennyisége. 2010-re 270 milliárd bázispárra nőtt. Ez azonban eltörpül a nyers adatok mennyisége mellett, amelyet a Trace archive and Sequence Read Archive (SRA)-ban tárolnak. Az itt tárolt mennyiség 25 trillió bázispár volt 2010-ben, amit, ha ebben a koordináta-rendszerben akarnánk ábrázolni, 12 méterre lógna ki a könyvből, ami kétszerese egy átlag zsiráf magasságának. Az ábra a Nature 2010:464:671 cikk ábrája alapján készült