A szárazföldi növények evolúciója és rendszertana Vezérfonal egy nem is olyan könnyű tárgy tanulásához Podani, János a szárazföldi növények evolúciója és rendszertana: Vezérfonal egy nem is olyan könnyű tárgy tanulásához


A.18. ábra. A Rosen-féle redukált área-kladogram (c



Yüklə 2,58 Mb.
səhifə23/31
tarix24.04.2018
ölçüsü2,58 Mb.
#40119
1   ...   19   20   21   22   23   24   25   26   ...   31

A.18. ábra. A Rosen-féle redukált área-kladogram (c) mint a kiinduló kladogramok (a—b) egy lehetséges konszenzusa

  1. Minden áreának egy taxon felel meg a kérdéses rendszertani csoportban (A.19.a. ábra). Ez a legegyértelműbb eset, az ábra példáján az 1-3 komponensekre (az 1. triviális).

  2. A taxonok száma kevesebb, mint az areáké, ezért a hiányzó áreák helyzete ismeretlen a kladogramon, megengedve számtalan alternatív lehetőséget (Az A.19.b. ábrán bemutatunk hármat). Ezek a 2.–3. komponenseket megerősíthetik, de újakat is eredményezhetnek.

  3. A taxonok száma meghaladja az áreákét. A redundáns információ ekkor egy kisebb fába sűríthető, s csak ebben kell komponenseket keresni (A.19.c. ábra). A példában a 7. új komponens jelentkezik.

  4. Egy vagy több taxon több területen is elterjedt, ami az área-kladogramon feloldatlanságot idéz elő. Ebben az esetben Nelson és Platnick (1981) után vagy azt feltételezzük, hogy 1) a több helyen élő faj valójában mindenütt jelen volt, csak a többi területről kihalt, a feloldatlan áreák tehát monofiletikus, ill. parafiletikus kapcsolatban vannak egymással (ezek láthatók az A.19.d. ábrán), vagy pedig 2) a kladogram csak az egyik ilyen áreára nézve informatív, míg a másikra nézve nem, mert a faj elterjedését is megengedjük, ami a kladisztika nyelvén a feloldatlan áreák polifiletikus eredetét is jelentheti (mint az A.19.e. ábra kladogramjain, ahol az A pozícióját vesszük bizonytalannak).

A komponensek listája attól függ tehát, hogy a nagy elterjedésű taxonok esetében melyik feltételezést alkalmazzuk. A listában minden bizonnyal lesznek egymásnak szögesen ellentmondó komponensek is (az A.19. ábra – szándékosan – ezt illusztrálja). Ha ezeket egyidejűleg figyelembe akarjuk venni, akkor könnyen kaphatunk egy igencsak triviális politómikus konszenzus kladogramot (A.19.f. ábra), ami nem biztos, hogy továbblépés a Rosen-féle redukált kladogramhoz képest (legfeljebb annyiban, hogy minden área benne van). Azt is megtehetjük, hogy a komponensek egy részét mint „hamisat” elvetjük, s a megmaradtak segítségével állítjuk elő a végeredményt. (Például a 2., 3., 4. és 10. komponensek alapján kapott, részben dichotomikus kladogram az A.19.g. ábrán.)

A fenti módszer nem nélkülözi a szubjektív elemeket, s ezen egy „trükkel” segíthetünk, Brooks (1981) nyomán. Az egyes komponensek bináris adatvektorok formájában is felírhatók (xij=1, ha a j área benne van az i komponensben, xij=1, ha nincs). Ezek a vektorok egy taxon x komponens adatmárixban összesíthetők, s a szokásos karakter alapú parszimónia elemzéssel vizsgálhatók (vö. Humphries és mtsai. 1988). Az így kapott maximálisan „takarékos” kladogram már mentes a konszenzuskeresés problémáitól. Persze „cseberből vederbe” is eshetünk, hiszen számos, egyformán optimális parszimónia kladogramot is kaphatunk eredményül.



A19. ábra. Komponensek azonosítrása különböző típusú área-kladogramokon (a–e). f: az área-kladogramok összesítése minden komponens alapján egy triviális politómiára vezet, g: az área-kladogramok összesítése a 2., 3., 4. és 10. komponensek figyelembevételével

6. A.6. Kladogramok összehasonlító összegzése: a konszenzus módszer

6.1. A. 6.1. Konszenzus fák

Alternatív kladogramok (vagy dendrogramok) konszenzus formában történő összesítése napjainkban a szisztematikában izgalmas feladatot jelent, hiszen gyakran előfordul, hogy egy adott taxonhalmazra a parszimónia módszerek sok, néha több száz (!) egyformán parszimónikus eredményt adnak. Az esetek túlnyomó többségében a fa topológiai szerkezetének az egyesítése a feladat, az élek hossza általában „feledésbe merül” (a kivételt lásd lentebb). A konszenzus fák általában csak nem bináris elágazások megengedésével képesek magukba sűríteni az információt (eltekintve persze attól, amikor minden eredmény egyforma). Mindez különösen jól megfigyelhető a szoros konszenzus fa („strict consensus tree”, Sokal és Rohlf 1981b, Swofford 1991) esetében, amely definíció szerint csak olyan osztályokat tartalmazhat, amelyek mindegyik eredményben megvoltak. Más szóval: ha az objektumok egy csoportja megjelenik a konszenzus fán, akkor az bizonyosan megvan az összes többi eredményben is, és ez hallatlanul megkönnyíti a konszenzus értékelését. (Vizsgáljuk meg az A.20. ábrán látható a, b és c fákat, amelyeket a d szoros konszenzus fa egyesít. Az {A,B,C} osztály az egyetlen, amely mindhárom kiindulásban megvan. Ebből látszik a szoros konszenzus hátránya, a politómiák esetleges túlburjánzása.) Szélsőséges esetben, mint pl. az A.19. ábra kladogramjainál, a szoros konszenzus fa minden ága közvetlenül a gyökérből indul ki (ún. „bokor”), tehát nem túlzottan érdekes a számunkra. Voltaképpen minél kevesebb politómia van a konszenzus dendrogramon, annál nagyobb az egyetértés a kiinduló dendrogramok között (ezt méri az egyik konszenzus index, lásd A.6.2.).

A félig szoros („semi-strict”) vagy kombinációs konszenzus (Bremer 1990, Swofford 1991, Quicke 1993) némiképpen toleránsabb az előzőnél. Itt az a kikötés, hogy a konszenzus eredmény osztályai nem lehetnek ellentmondásban a kiinduló fák egyikével sem. Mivel az {ABC} csoport léte az A.20.c. fában nem zárja ki az {AB} csoportot, a konszenzus fa e három objektumra nézve már bináris szerkezetű lesz (A.20.e.). Ha a kiinduló fák teljesen binárisak, akkor a szoros és a félig szoros konszenzus szükségképpen megegyező. A többségi konszenzus fa (Margush és McMorris 1981) még több eltérést enged meg, mert egy konszenzus osztály megjelenésének az a feltétele csupán, hogy a kiinduló fák több mint a felében meglegyen. Ennek megfelelően a példa dendrogramok többségi konszenzusa (A.20.f. ábra) már teljesen bináris szerkezetű: osztályai ({BC}, {ABC}, {ABCF}, {DE}, {ABCDEF} és {G}) a kiinduló eredmények közül legalább kettőben felfedezhetők. A többségi feltétel (majority rule) persze változtatható, sok dendrogram esetén 50%-nál magasabbra is emelhetjük a tűréshatárt. Könnyen belátható, hogy két fa esetében a szoros és a többségi konszenzus megegyező. Megemlítendő még a medián konszenzus fa is (Barthélemy és Monjardet 1981, Barthélemy és McMorris 1986), amelyhez alkalmaznunk kell egy megfelelő függvényt a fák összevetésére, páronkénti távolságának a kifejezésére. A medián konszenzus az a fa lesz, amely átlagosan a legközelebb esik az öszes többihez (Barthélemy és McMorris 1986), amely persze nem feltétlenül bináris, s nem feltétlenül csak egy van belőle! Ha ragaszkodunk ahhoz, hogy a medián konszenzus mindenképpen teljesen dichotomikus legyen, akkor Penny és mtsai. (1982) tanácsait követhetjük („medián bináris fa”, Swofford 1991).

A nem szoros konszenzus fák esetében az egyes kládok mellé írt számokkal fejezhetjük ki, hogy az adott részfa a kiinduló fák hány százalékában szerepelt ugyanazokkal az objektumokkal. Ez részletesen tájékoztathat bennünket az eltérésekért elsősorban „felelős” taxonokról, s megmutathatja a konszenzus fa „gyengébb” pontjait.

Konszenzus fák előállítására a történetileg legelső javaslat érdekes módon nem egyezik meg egyik eddig tárgyalt, az egyes részfákra, ill. osztályokra „kiélezett” módszerrel sem. Adams (1972) elképzelése az volt, hogy megvizsgálja: miképpen „hasadnak” a nagyobb osztályok egyre kisebb csoportokra, ahogy a gyökértől kezdve a fa végágai felé közeledünk. Először a gyökérnél meghatározott partíciókat állítjuk elő, s képezzük ezeknek a szoros konszenzusát. Az A.20.a-c. dendrogramokon az így kapott partíciók: {ABCDE}{FG} és {ABCDEF} {G} kétszer. Ezekből az {ABCDE}{F}{G} szoros konszenzus partíció adódik, a konszenzus fában tehát egy trifurkációval kezdünk. Ezután már csak az {ABCDE} csoport további elemzése van hátra, hasonló elvek szerint, az A.20.g. ábrán látható eredménnyel. Az Adams-féle módszerrel szemben felhozott leggyakoribb ellenérv az, hogy olyan osztályok is jelentkezhetnek benne, amelyek az eredeti fák egyikében sem szerepeltek (A.21. ábra).



A.20. ábra. Konszenzus fák. Az alternatív eredmények (a—c) egyesítése a szoros konszenzus (d), a félig szoros konszenzus (e), a többségi (>50%) konszenzus (f), az Adams-konszenzus (g) és a „durchschnitt” konszenzus (h) szerint. Figyeljük meg, mennyire „sikeresek” az egyes konszenzus fák az a—c dendrogramok egyesítésében!

A hierarchikus szinteket is figyelembe vevő, tehát dendrogramokra és nem kladogramokra alkalmas módszer az ún. „durchschnitt” (keresztmetszet) konszenzus (Neumann 1983, Smith és Phipps 1984). Ez felülről lefelé haladva összeveti a dendrogramok elmetszéséből kapott partíciókat, és minden szintre előállítja a szoros konszenzus partíciót. Ezek osztályai alkotják az egyes szinteknek megfelelő elágazásokat a konszenzus fában. Kellő mélységig lemenve a dendrogramokon megkapjuk az objektumok triviális felosztását m osztályra, s a konszenzus fa szerkesztése befejeződik (A.20.h. ábra). Mint a leírásból is látszik, a hierarchikus szintek tényleges értékei végül is nem számítanak, csak a szintek sorrendisége. Itt is könnyen kapunk olyan csoportokat, amelyek a kiinduló dendrogramok egyikében sem figyelhetők meg.

Végezetül a metszéses módszert (Finden és Gordon 1985) érdemes megemlíteni, ami nem törekszik arra, hogy az összes objektumot szerepeltesse a konszenzus fában. Ennek az a célja, hogy a „kilógó”, vagyis az ellentmondó helyzetű ágak fokozatos eltávolításával egy olyan fa maradjon, amely már minden tekintetben összhangban van a kiinduló fákkal. Ilyen fa persze sokféle lehet, s ezek közül azokat érdemes kikeresni, amelyek a legnagyobb számú objektumot tartják meg („largest common pruned tree”). Ennek akkor van igazán értelme, ha néhány objektum rendkívül ingadozó helyzete okozza csupán az eltéréseket. A módszer hátránya az, hogy nem ismerjük a legnagyobb fa biztos megtalálásának a módját (az összes lehetőség megvizsgálása nagy m-re – a már ismert elvi okok miatt – kizárt).



A.21. ábra. Az Adams-konszenzus (c) fő „hibája”, hogy a kiinduló fák (a—b) egyikében sem szereplő csoport(ok) is lehet(nek) benne, viszont elég jól kifejezi a legtöbb objektumpár relatív közelségi viszonyait.

6.2. A. 6.2. Konszenzus indexek

Amennyiben több fa konszenzusát nem egy másik fa formájában, hanem csupán egy mérőszámmal akarjuk kifejezni, akkor a konszenzus indexeket (Rohlf 1982) alkalmazhatjuk. Ezek valójában a k fa „globális” hasonlóságát fejezik ki egy, a 0 és 1 közé eső számmal. A témáról Rohlf imént idézett cikke és Swofford (1991) eléggé kimerítő összesítést ad, így csak néhány indexet említünk most meg.

A legegyszerűbb közülük a Colless (1980) -féle „consensus fork index”, ami a konszenzus fa bináristól való eltérésének a jelzője. Ez a konszenzus fában lévő nem triviális osztályok száma, osztva m–2-vel, az összes lehetséges nem triviális osztályok számával. Az index értéke az A.20.d. dendrogram esetén 0,2 (mert csak egy osztály jelent meg az öt lehetségesből), 0,4 az A.20.g. fára, és természetesen 1 a teljesen bináris A.20.f. fára. A Mickevich-index (1980) az egyes konszenzus osztályokat méretük szerint súlyozza, és e tekintetben továbblépést jelent az előző indexhez képest. Ha az i osztály mérete ni, akkor ennek fontossága Ni = min { ni – 1, m – ni }. Eme fontosság értékeket összegezve, majd elosztva azt az index lehetséges maximumával, megkapjuk a kívánt mértékszámot. A fent említett három esetben az index értékei: 0,222, 0,444, ill. 0,888. Végezetül, Schuh és Farris (1981) egészen más súlyozást ajánl: minden osztályra számoljuk ki az objektumpárok számát, vagyis Ni = ni ( ni – 1 ) / 2, s ezeket összegezzük („levels sum”). A példákban (az A.20.d., g. és f. fákra) 3, 26 és 13 adódik. Az összegek a maximummal akár oszthatók is, hogy az index értéke a [0,1] intervallumba kerüljön. A normálás problémája minden említett index esetében az, hogy a maximum nagymértékben függ a fa alakjától („láncszerű”-nél nagyobb, mint a teljesen szimmetrikus fában).

7. A.7. Kladogramok „szignifikanciája”: a bootstrap és a jackknife

7.1. A. 7.1. Bootstrap

Az evolúciós fák becslése molekuláris adatokból voltaképpen mindig mintavételi hibával terhelt folyamat, bár erről eddig még nem szóltunk. Lényegében véve arról van szó, hogy az evolúciós fa alakja nagymértékben függhet (és függ is) attól, hogy mely géneket, mely bázispárokat vesszük bele az elemzésbe. Ennek megfelelően egy fa statisztikai értelemben annál megbízhatóbb, minél kevésbé befolyásolja alakját ez a döntés. Döntésünk hatásának ellenőrzésére sok elemzést kellene végrehajtanunk, a genomból véletlenszerűen kiválasztott bázispárok alapján. Ez számos okból nem lehetséges, ezért egy olyan szellemes módszert hívunk segítségül Felsenstein (1988) nyomán, amely eme döntéseink hatását a rendelkezésünkre álló szekvenciarészletből is ki tudja mutatni. A módszer neve, bootstrap elemzés, az angol „pull yourself up by your own bootstraps”, azaz kb. „segíts magadon, ahogy tudsz” kifejezésből ered. Segítünk magunkon, hiszen százalékos megbízhatóságot számolunk ki egyetlen minta felhasználásával. A módszer visszatevéses véletlen mintavétellel pszeudoszekvenciákat állít elő az aktuális szekvencia pozícióiból. A visszatevések miatt persze lesznek olyan pozíciók, amelyek többször szerepelnek, mások pedig egyszer sem kerülnek bele egy adott pszeudoszekvenciába. Ez az a pont, ahol a statisztikai ingadozásokat magunk „engedjük be” szándékosan a vizsgálatba. Minden egyes ilyen pszeudoszekvenciából elő kell állítani a törzsfát, mindig ugyanazzal a módszerrel. A mintavétel-törzsfagyártás kettős munkafolyamatát nagy számban, mondjuk 1000-szer megismételjük, vagyis igen sok alternatív bootstrap fát állítunk elő ugyanarra az m taxonra. Ezek után már csak azt kell megvizsgálnunk, hogy milyen kládok és milyen százalékban jelentek meg az ismétlések során, s ebből következtethetünk az egyes részletek statisztikai megbízhatóságára.

Mindezt Brown és mtsai. (1982) adatainak felhasználásával illusztráljuk, a Page és Holmes (1999) könyvéből származó eredménnyel. Az alapszekvencia abból a 90 pozícióból áll, amelyben az ember és még négy főemlős (1. a fenti példákat) mitokondriális DNS-e eltér (A.22.a. ábra). A 90 pozícióból mint statisztikai alappopulációból 100-szor veszünk visszatevéses, 90-elemű mintát, s mindegyikből rekonstruáljuk a törzsfát. Háromféle eredményt kapunk (A.22.b. ábra). Mint látható, a gibbon-orángután részfa 100%-os bootstrap támogatást élvez, hiszen minden fában jelentkezik. Az ember és az afrikai főemlősök kapcsolata azonban nem egyértelmű, a háromféle lehetséges részfa támogatottsága hasonló (41%, 28% és 31%). Ez arra enged következtetni, hogy e három faj esetében a felhasznált információ nem elégséges a leszármazási viszonyok megbízható feltárásához, s további szekvenciákat is figyelembe kell vennünk.



A.22. ábra. Főemlősök mtDNS-ének 90, eltérést mutató pozíciója (a), és az ebből nyert bootstrap fák (b), a relatív gyakoriságokkal (Page és Holmes 1999 után)

A gyakorlatban persze a példában alkalmazott öt taxonnál rendszerint jóval több, akár több száz taxon is szerepelhet az elemzésben, a fenti módszer tehát nem alkalmazható a lehetséges részeredmények követhetetlenül nagy száma miatt. Ilyen esetekben bevált stratégia a bootstrap fák konszenzusának előállítása, mondjuk a többségi konszenzus módszerrel. Az eredményül kapott egyesített fán jól láthatók lesznek azok a részfák, amelyek az esetek legalább 50%-ában előfordultak. A konszenzus fa megfelelő ágain ekkor kis számokkal tüntethetjük fel a bootstrap megbízhatóság százalékait. (A többségi konszenzus fa az 50%-ot el nem érő részfák gyakoriságának felmérésére viszont nem alkalmas, hiszen éppen ezeket „áldozzuk fel” a többségi részfák bemutatása végett, tehát nem mindig mutatkoznak az eredményben.)

7.2. A. 7.2. A jackknife

A statisztikai megbízhatóság mellett a kladogram stabilitása is fontos szempont. Ha egy taxon szerepeltetése vagy esetleges kihagyása az értékelésből nagymértékben befolyásolja a fa szerkezetét, esetleg még azon a részen is, ahol nem szerepel, akkor fenntartásaink lehetnek a törzsfa stabilitását illetően. Mindig előfordulhat ugyanis, hogy fontos taxonok kimaradnak, de ettől még azt szeretnénk, ne változzon lényegesen a többi taxonra vonatkozó evolúciós hipotézisünk. A stabilitás elemzésére a jackknife módszer alkalmas. Ennek egyszerű a stratégiája: az elemzést megismételjük oly módon, hogy mindig csak egy taxon marad ki a törzsfa szerkesztéséből. Ezek után egyszerűen megvizsgálható, hogy az egyes részfák az esetek hány százalékában maradtak érintetlenek. Ezeket a számokat az élek mentén fel is tüntethetjük. A nagy százalékban megmaradt kládok stabilisnak tekinthetők.

8. A.8. Kladisztika és taxonómia

A hagyományos, a Linné-féle elképzeléseken alapuló taxonómiai hierarchiák sok esetben lényegesen különböznek a kladisztikai úton nyert törzsfáktól. Erre bőven láttunk példát e könyv fejezeteiben, elegendő ha csak a zárvatermők rendszerére gondolunk. E tartalmi eltérések jelentős forrása lehet az, hogy a kladogramok sokkal több hierarchikus szintet tartalmaznak, mint a tradicionális osztályozások. Amennyiben a törzsfákat közvetlenül szeretnénk a rendszerezésbe is átvinni, a sok szint nómenklatúrai problémákat is felvet.

Vizsgáljuk meg például az A.23.a. ábra kladogramját! A gyökértől kiindulva az egyes taxonok fokozatosan, egyenként válnak le a főágról, így a kapott hierarchikus szintek száma csupán eggyel kevesebb a taxonok számánál: a fa topológiája erősen „aszimmetrikus”. Ha tehát kladisztikailag is monofiletikus taxonokat szeretnénk definiálni, akkor az elnevezéssel és a kategorizálással bajban leszünk, hiszen nincs annyi nómenklatúrai kategória, amennyire ez esetben szükség lenne. S ha lennének is ilyen kategóriák, bizonnyal elvesznénk az al-alalcsaládok és fő-fő-főrendek dzsungelében. Sok esetben persze célszerű az ilyen jellegű kategóriák használata, de akkor azok nem biztos, hogy megfelelnek a nómenklatúrai szabályoknak. Ilyen az Embryophyta — Tracheophyta — Euphyllophyta kladisztikai kategóriarendszer is, hiszen ezek végződései törzsekre utalnak, bár távolról sem törzsekről, hanem jóval átfogóbb kategóriákról van esetükben szó.



A.23. ábra. Fésűs elágazási mintázat (a), amely „megnehezíti” a kladisztikai eredmények alkalmazását a formális osztályozásokban. A b kladogram a taxonómia és a kladisztika egy másik lehetséges konfliktusát illusztrálja: az autapomorfiák nagy száma miatt a C taxon klasszifikációs helyzete vitatott.

A szimmetrikus, a kategórákat minden ágon nagyjából két egyenlő csoportra felosztó kladogramok interpretációjával is gondban lehet a klasszikus alapokon álló rendszertanos. Az autapomorfiák, vagyis a végágakon jelentkező változások ugyanis kladisztikailag nem informatívak, ugyanakkor egy taxon jellemzésénél nagy súllyal eshetnek latba, ami nyilvánvaló konfliktust eredményez.



Ezt illusztrálja az A.23.b. ábra kladogramja. A kladista számára a B és C taxonok egybetartozása, mondjuk egy génuszba, vitathatatlan tény. A rendszertanos viszont, az évszázados gyakorlat alapján, joggal tenné a B-t inkább az A-val egy génuszba, hiszen ezek csak két karakterben különböznek egymástól, míg a C a B-től négyben! Az {A,B} taxon viszont kladisztikailag parafiletikus, és kerülendő. Ha a ma érvényes rendszereket alaposan megvizsgálnánk a kladisztikai eredmények tükrében, akkor sok taxon bizonyulna parafiletikusnak. Ezek felbontása még nagy ellenállásba ütközne, de legalábbis igen szokatlan rendszereket eredményezne. E könyvben láttunk bőven példát erre, jelezve, hogy a jövőben előbb-utóbb sort kell kerítenünk a parafiletikus taxonok revíziójára. A kladisztikai álláspont teljesen határozott ebben a kérdésben: az elnevezéseknek és az osztályozásoknak monofiletikus, ún. „korona”-kládokon kell alapulnia (De Queiroz és Gauthier 1990, Bryant 1994).

A.2. táblázat. Egyes emlősök immunológiai távolsága Sarich (1969) nyomán, az albumin szerint. A távolság d = 100 x log ID, ahol ID a szükséges antigén koncentráció szintje.


Macska

Medve

Mosómedve

Kutya

Oroszlánfóka

Fóka

Amerikai

néyrc

Majom

Macska

0






















Medve

84

0



















M.medve

92

26

0
















Kutya

98

32

48

0













Or.

fóka

86

33

44

48

0







Fóka

89

29

44

50

24

0







Am.

nyérc

90

34

42

51

38

44

0

Majom

148

136

152

148

142

142

142

0

Yüklə 2,58 Mb.

Dostları ilə paylaş:
1   ...   19   20   21   22   23   24   25   26   ...   31




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©www.genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə