Ugrás a tartalomhoz

Genetika és genomika

Falus András, László Valéria, Tóth Sára, Oberfrank Ferenc, Pap Erna, Dr. Szalai Csaba (2014)

Typotex Kiadó

Statisztikai problémák

Statisztikai problémák

Egy következő probléma az adatok elemzéséből, azaz az alkalmazott statisztikai módszerekből származik [9.5]. Az eddig talált, betegségekre hajlamosító variációk jellemzően csak 10–20%-kal emelik meg hordozójukban a betegségre való hajlamot. Ez azt jelenti például, hogy annak az esélye, hogy a variációt hordozó beteg legyen 1,1–1,2-szer magasabb, mint annak, aki nem hordozza. Az ilyen gyenge hatású gének detektálása pedig nagyon nehéz. Ráadásul a vizsgált betegek genetikailag heterogének, azaz egy azon betegségre számos (gyakorlatilag szinte végtelen számú) genetikai háttér hajlamosíthat. Statisztikai szempontból pl. előnyös, ha minél nagyobb populációt vizsgálunk, genomikai szempontból azonban egyre nő a populáció genetikai heterogenitása, így az egyes genetikai variációk hatása felhígul.

Egy másik probléma ezzel kapcsolatban a megfelelő statisztikai módszer hiánya. Probléma például a többszörös teszt okozta statisztikai hiba kiküszöbölése. Százezer variáció mérése egyetlen chippel statisztikai szempontból azt jelenti ugyanis, hogy 100 ezer független mérést végzünk. Ilyenkor az egyes asszociációknál a hamis állítás valószínűsége összeadódik (1-es típusú statisztikai hiba). Ennek az egyik megoldása, ha a statisztikai hibahatárt elosztjuk a vizsgálatok számával. Ezt Bonferroni-korrekciónak hívjuk. Például 100 ezer SNP vizsgálatánál p = 0,05 helyett 5x10-7 értéket használunk. Azonban a független vizsgálatok tényleges száma nemcsak az SNP számától, hanem számos más körülménytől is függ, így pl. a mintaszámtól, a teszttől, vagy a vizsgált klinikai paraméterek számától is. Azonban a Bonferroni-korrekció túl konzervatív, hiszen csak a nagyon erős asszociációt mutató faktorokat tudja detektálni. Ezzel szemben a multifaktoriális betegségeknek éppen az az egyik legfőbb jellemzője a CD/CV hipotézis alapján, hogy a betegségre való megnövekedett hajlam sok, önmagában csak nagyon gyenge hatású genetikai variáció kölcsönhatásából ered. Ráadásul ezek a betegségek populációs szinten genetikailag heterogének, azaz az egyes emberekben más-más genetikai faktorok lehetnek felelősek a betegségért. Ennek az lesz a következménye, hogy a legtöbb genetikai variáció eloszlása csak nagyon kis mértékben fog különbözni a beteg és az egészséges populáció között, és a fent leírt statisztikai módszerrel nem lehet detektálni őket. Ráadásul a helyzetet több más tényező tovább bonyolítja, illetve a statisztikai értékelhetőséget rendkívüli mértékben megnehezíti. Az egyik legnagyobb, hogy nem elég a 100 ezer variációt egyenként vizsgálni, hanem a variációk kölcsönhatásait is, hiszen előfordulhat, hogy az egyes variációk önmagukban nem, csak más variációkkal, vagy esetleg valamilyen környezeti faktorral együtt hatva okozzák a vizsgált fenotípust. Ilyenkor a vizsgálandó kölcsönhatásoktól függően az elvégzendő elemzések száma csillagászati magasságokban van. Például, 1,8 millió variáció esetén csak a páros, elemzendő gén-gén kölcsönhatások száma 3,2 billió, és ismert, hogy ilyen kölcsönhatásokban sokszor akár több száz szereplő is lehet.