Ilość SNP w drzewie R1a i R1b

Moderator: Lappa


Posts: 748
Joined: Thu Mar 15, 2012 10:08 am
Location: Warsaw, Poland
YDNA:
R1a-L1280
MtDNA:
H2a2
PostPosted: Wed Nov 12, 2014 2:59 pm
Atim wrote:Faktycznie nie zwróciłem uwagę na te 35 ZNP "prywatnych" MA-1. Właśnie dlatego, że je na forach nazywali "prywatne', jakoś je zlekceważyłem i nie wprowadziłem w obliczenia czasu R*.

Szkoda tylko, że w dalszym ciągu nie uwzględniasz tych wyników i sugerujesz (nie popierając tego żadnymi wiarygodnymi danymi), że rozdzielenie się linii R1a i R1b mogło mieć miejsce mniej niż 24.000 lat temu.
Prawdę powiedziawszy, żadna z liczb, które podajesz w całym cytowanym tutaj poście, nie znajduje uzasadnienia w żadnych opublikowanych danych.

Atim wrote:Moim zainteresowaniem jest całe drzewo AMH. Więc szukam najbardziej pelnych danych i nie mogę się ich doczekać.

Jak zwykle nie czytasz moich odpowiedzi na Twoje posty, ale przypomnę Ci mimo wszystko raz jeszcze, co uprzednio napisałem na ten temat:
""Pełnego" drzewa nie otrzymamy pewnie nigdy (a przynajmniej nieprędko), bo niektórych obszarów chromosomu Y nie da się na razie analizować. Nie jest to zresztą wcale potrzebne, zwłaszcza jeśli uzmysłowimy sobie, że do w miarę wiarygodnych obliczeń znacznie przydatniejsze są wyniki uzyskane dla ściśle zdefiniowanego (nawet stosunkowo niewielkiego) regionu chromosomu Y, niż mieszanie ze sobą wyników uzyskanych dla znacznie większych (ale nieporównywalnych ze sobą) fragmentów chromosomu (o czym wydajesz się niestety nie pamiętać, przedstawiając swoje "obliczenia")."

Atim wrote:Natomiast do tych stop czasu mutacji SNP też nie bardzo mam zafanie. Jest wiele propozycji i niepewne punkty odniesienia.

Moim zdaniem zdecydowanie nie masz racji. Tempo mutacji dla Y-DNA, wynoszące ok. 0,7 x 10^--9 na nukleotyd na rok, którą to liczbę sugerowałem już jakiś czas temu na podstawie pierwszych publikacji na ten temat
(http://www.anthrogenica.com/showthread. ... ing/page11), zostało potwierdzone nie tylko wynikami z Malty, ale także ostatnimi obliczeniami przeprowadzonymi przez autorów niedawnej pracy o datowanym radiowęglowo mężczyźnie z Ust'-Ishim (http://www.nature.com/nature/journal/v5 ... 13810.html). Trzeba tylko umieć przeliczać tę wartość na odpowiednią "liczbę lat na mutację", w zależności od długości analizowanej sekwencji Y-DNA (która jest inna niemal w każdej publikacji, nie mówiąc o różnicach między różnymi komercyjnymi testami, takimi jak Big Y albo Y Elite), czego Ty wydajesz się zupełnie nie uwzględniać, i co sprawia, że podawane przez Ciebie liczby są zupełnie niewiarygodne.

Atim wrote:Zresztą widzimy teraz różnicę prędkości mutacji w R1a i R1b - tak na drzewie Yfull, jak i na drzewie Raghavana (tu 176 i 127, myślę, że nie tylko za sprawą tylko dwóch ht w R1a).

Zupełnie nie wiem, skąd wziąłeś liczbę 176, jako reprezentującą liczbę mutacji w linii R1a (poniżej poziomu R1). Z kolei liczba 127 odpowiada nie analogicznej liczbie dla całej linii R1b, a jedynie dla jej fragmentu od poziomu R1 do rozdzielenia się pięciu analizowanych linii R1b. Podobnie, umieszczona w pracy Raghavana (w odniesieniu do linii R1a) liczba 155 nie oznacza wszystkich mutacji poniżej poziomu R1, a jedynie te, które były wspólne dla obu analizowanych próbek R1a.

W związku z powyższym do obliczania wieku R1 lub R nadają się w tym przypadku jedynie liczby podane dla haplogrupy R2 i Q (bo dla tych linii podane są rzeczywiście liczby "wszystkich"* mutacji poniżej pewnego poziomu filogenetycznego, w tym przypadku odpowiednio poniżej R lub P).

* - "wszystkie" oznacza w tym przypadku wszystkie mutacje znalezione w określonym regionie chromosomu Y, a nie w całym chromosomie.

Atim wrote:W sumie, uśredniając pod R1 otrzymujemy 141 SNP u Raghavana, a pod R* 180 SNP

Żadna z tych liczb nie znajduje uzasadnienia w danych przedstawionych przez Raghavana i wsp.

Atim wrote:i średnią częstość jednej mutacji : 166 lat.

Na jakiej podstawie to wyliczyłeś? (Tak właściwie to jest to pytanie retoryczne, bo wiem, że Twoje przesłanki były błędne, więc możesz na to nie odpowiadać.) Wydaje się, że w tym przypadku znacznie poprawniejsze byłoby użycie liczby 159 lat na mutację, co odpowiada wzmiankowanemu powyżej tempu mutacji 0.7 x 10^--9 na nukleotyd na rok, w przeliczeniu na fragment chromosomu Y o sumarycznej długości 8,97 Mb, czyli w przeliczeniu na region analizowany w pracy na którą powołuje się Raghavan w tym kontekście (Wei i wsp., 2013).

Atim wrote:Dlatego R* liczy około 29.900, a R1 około 23.400 lat

Te szacunki nie mają żadnego oparcia w danych z pracy Raghavana, a są przy tym zupełnie niezgodne z wnioskami wynikającymi z radiowęglowego datowania chłopca z Malty (na 24 tys. lat temu) oraz z liczby znalezionych u niego 35 prywatnych mutacji (w porównaniu do zaledwie 23 mutacji (w analizowanym regionie chromosomu) oddzielających "węzeł" R1a/R1b od ich wspólnego przodka należącego do nieco zmodyfikowanego poziomu R*).

Biorąc pod uwagę wszystkie korekty podanych przez Ciebie liczb, spróbujmy więc wykorzystać dane z pracy Raghavana do zgrubnego obliczenia wieku haplogrup P, R i R1. W haplogrupie Q znaleziono 232 mutacje poniżej poziomu P, natomiast w haplogrupie R2 znaleziono 220 mutacji poniżej poziomu R. Ponieważ między poziomem P i R2 znaleziono 41 mutacji (36+5), możemy obliczyć, że linia R2 zawiera w sumie 261 mutacji poniżej poziomu P. Jest to o tyle ważne, że dysponując odpowiednimi liczbami mutacji poniżej poziomu P dla dwóch niezależnych linii (Q oraz R2), możemy obliczyć bardziej wiarygodną średnią liczbę mutacji poniżej P, która w tym przypadku wynosi 246.5 ((261+232)/2), co z kolei odpowiada 39,2 tys. lat (246,5 x 159) jako przybliżonemu wiekowi haplogrupy P, i jest jak najbardziej zgodne z moimi wcześniejszymi szacunkami na podstawie kilku zupełnie innych zestawów danych:
http://www.anthrogenica.com/showthread. ... #post26002

Wiek haplogrupy R (czyli moment rozdzielania się linii R1 i R2) możemy w tym przypadku obliczyć na dwa różne sposoby. W pierwszym odejmujemy liczbę 41 mutacji (poniżej P i powyżej R1+R2) od obliczonej powyżej średniej liczby mutacji poniżej P, co daje nam 205,5 (czyli 32,7 tys. lat). W drugim sposobie wykorzystujemy tylko liczbę mutacji (poniżej R) znalezionych w linii R2, czyli 220, co z kolei odpowiada wiekowi 35,0 tys. lat. Najbardziej wiarygodnym szacunkiem będzie w tym przypadku średnia z obu powyższych wartości, czyli mniej więcej 33,8 tys. lat.

Wiek haplogrupy R1 możemy oszacować obliczając liczbę mutacji poniżej poziomu R1, przy czym można to osiągnąć odejmując liczbę 35 mutacji (z poziomu R1) od liczby 220 mutacji poniżej R w linii R2 (co daje w efekcie 185 mutacji albo 29,4 tys. lat), albo odejmując tę samą liczbę 35 mutacji (z poziomu R1) od obliczonej wcześniej nieco bardziej "zbalansowanej" liczby mutacji poniżej R (czyli od 205,5), co z kolei daje nam 178,25 mutacji albo 28,3 tys. lat.

W każdym z powyższych przypadków należy oczywiście uwzględnić pewien margines błędu (ok. +/- 10%).

Dane z pracy Raghavana pozwalają także z grubsza oszacować wiek haplogrup CT, GHIJK, IJK oraz K2, ale może spróbujesz sam to sobie obliczyć (na podstawie powyższych wskazówek). Dodam tylko, że szacunki te zgadzają się niemal doskonale z tymi opartymi na podstawie wyników z Ust'-Ishim (materiały dodatkowe, str. 53, http://www.nature.com/nature/journal/v5 ... 810-s1.pdf).

Atim wrote:Natomiast Y-Adam, biorąc pod uwagę najbardziej pełne drzewo: Yfull i częstośc mutacji 166 lat, żyłby 227.000 lat temu.

Nie wiem dlaczego zupełnie ignorujesz moje uwagi dotyczące ewidentnych błędów w Twoich założeniach (zwłaszcza w odniesieniu do sumowania lub porównywania mutacji znalezionych przy analizowaniu fragmentów chromosomu Y o różnej długości), ale skoro widzę, że moje interwencje nie odnoszą żadnego skutku, to chyba odpuszczę sobie dalsze próby korygowania Twoich obliczeń.

Gdybyś miał ochotę na lekkie "udoskonalenie" szacunków Mendeza i wsp. dotyczących wieku Y-Adama, to proponuję przekalkulować ich dane wprowadzając nieco bardziej prawdopodobne tempo mutacji 0,7 (zamiast 0.617). Otrzymany wynik będzie tylko nieco niższy od zakładanego przez Mendeza, ale za to znacząco wyższy od tego uzyskanego przez Elhaika, Klyosova i spółki (przy użyciu znacznie zawyżonego tempa mutacji 1,0, zweryfikowanego już zresztą negatywnie przez wszystkie otrzymane niedawno wyniki aDNA, włączając w to Maltę, Anzick i Ust'-Ishim).

Posts: 587
Joined: Thu Mar 15, 2012 11:59 am

YDNA:
Adam-L74; R1a-YP4700
MtDNA:
H14a
PostPosted: Wed Nov 12, 2014 6:12 pm
Michał wrote:
Atim wrote:Faktycznie nie zwróciłem uwagę na te 35 ZNP "prywatnych" MA-1. Właśnie dlatego, że je na forach nazywali "prywatne', jakoś je zlekceważyłem i nie wprowadziłem w obliczenia czasu R*.
Szkoda tylko, że w dalszym ciągu nie uwzględniasz tych wyników i sugerujesz (nie popierając tego żadnymi wiarygodnymi danymi), że rozdzielenie się linii R1a i R1b mogło mieć miejsce mniej niż 24.000 lat temu.
Prawdę powiedziawszy, żadna z liczb, które podajesz w całym cytowanym tutaj poście, nie znajduje uzasadnienia w żadnych opublikowanych danych.
Najpierw chcę podkreslić, że nie chodzi mi o moje racje i nie mam ochoty pisać przeciw cudzym racjom. Nigdy nie mam zamiaru trzymać się swojego zdania dlatego że jest moje. Szukam tylko prawdy naukowej. I dlatego, ku swojemu zmartwieniu, zbyt wiele razy zmieniam to, co napisałem, dostając jakies nowe dane (np. te nieszczęsne eksperymenty z drzewem filogemnetycznym; zawsze jednak sygnalizują, jaka jest ich podstawa!).
....................
W dyskutowanym temacie raczej żle mnie odczytujesz.
R1 split czyli rozdzielenie się linii R1a i R1b tylko pośrednio wynika z podanych przed Radhavana 24.000 lat.

R1 split (czyli R1a/R1b) obliczyłem w ten sposób:
Uśredniłem uśrednione R1a=155 SNP i uśrednione R1b=127 i dało mi 141 SNP. Do tego dodałem R1=35 i R' (Y482)=4 (zamiast 5, gdyż Yfull jednego snipa nie uznał, ale to pestka). Suma 180 SNP.
Czas 24.000 lat przez Raghavana był liczony po upływie 35 prywatnych SNP w MA-1. Czyli R* będzie starszy o czas tych 35 SNP ponad 24.000 lat.
Oznacza to też, że gdyby R* powstał 24.000 lat temu, miałby 35 SNP mniej, czyli 145 SNP.
I to jest punkt odniesienia. Dzielimy więc 24.000 lata na 145 SNP i mamy 166 lat na 1 SNP.
To ustalone teraz tempo mutacji stosujemy do obliczenia czasu 180 SNP, co nam daje 29.900 lat.
To samo tempo stosujemy do średniej 141 SNP pod R1, co daje 23.400 lat dla wydzielenia się linii R1a i R1b
Atim wrote:Moim zainteresowaniem jest całe drzewo AMH. Więc szukam najbardziej pelnych danych i nie mogę się ich doczekać.
Jak zwykle nie czytasz moich odpowiedzi na Twoje posty, ale przypomnę Ci mimo wszystko raz jeszcze, co uprzednio napisałem na ten temat:
""Pełnego" drzewa nie otrzymamy pewnie nigdy (a przynajmniej nieprędko), bo niektórych obszarów chromosomu Y nie da się na razie analizować. Nie jest to zresztą wcale potrzebne, zwłaszcza jeśli uzmysłowimy sobie, że do w miarę wiarygodnych obliczeń znacznie przydatniejsze są wyniki uzyskane dla ściśle zdefiniowanego (nawet stosunkowo niewielkiego) regionu chromosomu Y, niż mieszanie ze sobą wyników uzyskanych dla znacznie większych (ale nieporównywalnych ze sobą) fragmentów chromosomu (o czym wydajesz się niestety nie pamiętać, przedstawiając swoje "obliczenia")."
To wszystko wiem od dawna, bo od dawna śledzę to zagadnienie. I Twój tekst, choć nie jest Ewangelią, też czytałem i nadal będę czytał, choc raczej z rozwagą, Twoje wypowiedzi.

Ci autorzy, którzy posługują się ustalonymi przez siebie kryteriami, mają różne wyniki, m.in.dlatego, że mutacje nie miały żadnego kryterium i spacerowały po róznych odcinkach DNA, [b]koncentrując się to tu, to tam - w rozmaitych okresach czasu[/b].
Te autorskie wyniki nie bywają też zdolnie wznieść się wiele ponad 100 tysięcy dla np. A1; chyba rzadko mogą nawet osiągnąć wynik Crucianiego 142.000 lat, gdzie Mendez ma 209.000 lat.

Dlatego, poniewaz zauważyłem, że Yfull zbiera zasadniczo wszystkie wyniki opublikowane (czyli jakoś zweryfikowane, choć nie wszystkie przez siebie) i dodaje je (słowo "miesza" jest tu chyba nieodpowiednie), tę sumę wszystkich zweryfikowanych wyników też mogę uznać za podstawą uśrednienia, dokładniejszą niż wyniki jednego autora, dysponującego jednym wycinkiem DNA.

Posts: 748
Joined: Thu Mar 15, 2012 10:08 am
Location: Warsaw, Poland
YDNA:
R1a-L1280
MtDNA:
H2a2
PostPosted: Wed Nov 12, 2014 7:58 pm
Atim wrote: Najpierw chcę podkreslić, że nie chodzi mi o moje racje i nie mam ochoty pisać przeciw cudzym racjom. Nigdy nie mam zamiaru trzymać się swojego zdania dlatego że jest moje. Szukam tylko prawdy naukowej. I dlatego, ku swojemu zmartwieniu, zbyt wiele razy zmieniam to, co napisałem, dostając jakies nowe dane (np. te nieszczęsne eksperymenty z drzewem filogemnetycznym; zawsze jednak sygnalizują, jaka jest ich podstawa!).

Tu nie chodzi o to, czy Twoje szacunki zgadzają się z szacunkami innych, czy też nie, bo w zależności od przyjętych założeń (głównie dotyczących tempa mutacji), takie różnice mają prawo występować (przynajmniej dopóki nie dojdzie do powszechnej zgody w tej kwestii, co dzięki wynikom aDNA powinno nastąpić właściwie już niebawem). Chodzi o to, że Twój sposób obliczania TMRCA jest zupełnie nielogiczny, bo obliczając np. średnią liczbę mutacji dla danego kladu lub haplogrupy nie stosujesz tych samych kryteriów dla każdego poziomu filogenetycznego, sumując np. wszystkie znane mutacje z poziomu R1a+R1a1 (czyli w zasadzie te wykrywane testem Y Elite), ale dodając tylko część znanych mutacji z niższych poziomów (korzystając głównie z wyników Big Y) oraz ignorując często istnienie mutacji z najniższych poziomów (czyli prywatnych). Tak uzyskana średnia liczba mutacja dla przedstawiciela haplogrupy R1a nie jest w ogóle reprezentatywna i nie nadaje się do przeprowadzenia żadnych oszacowań. Jeśli chcesz otrzymać wiarygodne szacunki, musisz zadbać o to, aby do danej serii obliczeń wykorzystywać tylko mutacje identyfikowane przy użyciu jednej konkretnej metody, np. tylko mutacje z Big Y (albo tylko mutacje z konkretnej publikacji), a jeśli chcesz oprzeć swoje szacunki na pełniejszym zestawie mutacji wykrywanych przez Y Elite, to musisz w takim przypadku analizować tylko te linie R1a, dla których dysponujesz pełnymi wynikami Y Elite. Jest to tak oczywista sprawa, że aż trudno zrozumieć, dlaczego upierasz się przy obliczeniach wykorzystujących niemal zupełnie przypadkowe (a już na pewno źle zdefiniowane) zbiory mutacji.


Atim wrote: Uśredniłem uśrednione R1a=155 SNP i uśrednione R1b=127 i dało mi 141 SNP.

Tak jak napisałem uprzednio, ani 155 ani 127 nie oznaczają liczby "wszystkich" mutacji w liniach R1a i R1b (nie mówiąc już o tym, że nie są to liczby odpowiadające porównywalnym poziomom filogenetycznym), więc w ten sposób po raz pierwszy znacząco zaniżyłeś liczbę mutacji poniżej poziomu R1.


Atim wrote:Czas 24.000 lat przez Raghavana był liczony po upływie 35 prywatnych SNP w MA-1. Czyli R* będzie starszy o czas tych 35 SNP ponad 24.000 lat. Oznacza to też, że gdyby R* powstał 24.000 lat temu, miałby 35 SNP mniej, czyli 145 SNP.

To jest kolejny kardynalny błąd. Nie możesz porównywać tych 35 prywatnych mutacji np. z 35 mutacjami z poziomu R1 (albo ze 155 mutacjami poniżej poziomu R1 które są wspólne dla obu linii R1a), bo w pierwszym przypadku liczba ta obejmuje tylko mutacje zidentyfikowane w próbce aDNA, natomiast w pozostałych przypadkach liczby te dotyczą zarówno pozycji/mutacji zbadanych w aDNA, jak i takich, których nie udało się zbadać (czyli tych oznaczonych jako N). Innymi słowy, te 35 prywatnych mutacji możesz co najwyżej porównac do mutacji oznaczonych literkami a (ancestral) lub d (derived), które udało się zbadać w próbce aDNA.

To co napisałem powyżej oznacza, że na jedną prywatną mutację chłopca z Malty przypada znacznie więcej lat, niż np. na każdą mutację z poziomu R1 lub na każdą mutację z linii R2 lub Q (mniej więcej dwa razy więcej, ale tego nie da się chyba dokładnie wyliczyć, więc nie próbowałbym opierać na tym Twoich szacunków). Dlatego też Twój sposób wykorzystania tych mutacji do obliczeń był kolejną przyczyną znaczącego zaniżenia wieku R i R1. Nic dziwnego więc, że otrzymałeś wiek haplogrupy R1, który był sprzeczny z wynikiem analizy mutacji o mniej więcej "porównywalnym" statusie, a więc 35 prywatnych mutacji chłopca z Malty oraz 23 mutacji (oznaczonych literką a) dzielących naszego wspólnego przodka (z nowego poziomu R1a*) od punktu rozdzielenia się R1a i R1b.


Atim wrote:Ci autorzy, którzy posługują się ustalonymi przez siebie kryteriami, mają różne wyniki, m.in.dlatego, że mutacje nie miały żadnego kryterium i spacerowały po róznych odcinkach DNA, [b]koncentrując się to tu, to tam - w rozmaitych okresach czasu[/b].
Te autorskie wyniki nie bywają też zdolnie wznieść się wiele ponad 100 tysięcy dla np. A1; chyba rzadko mogą nawet osiągnąć wynik Crucianiego 142.000 lat, gdzie Mendez ma 209.000 lat.

Nie masz racji. Jeśli mówisz o różniących się wynikach otrzymywanych przez autorów poszczególnych publikacji lub też autorów niektórych w miarę wiarygodnych szacunków umieszczanych w internecie, to różniły się one głównie na skutek przyjęcia różnej wartości tempa mutacji, podczas gdy różnice wynikające z innych przyczyn były na ogół nieznaczące statystycznie. Tak jak napisałem powyżej, podejrzewam, że już wkrótce dojdzie do powszechnej zgody w tej kwestii, bo wyniki z Ust-Ishim są po prostu więcej niż przekonujące (a co najważniejsze zgodne z wynikami z Malty i Anzick, nie mówiąc już o zgodności z większością "umiarkowanych" szacunków poprzedzających te odkrycia). Możemy się więc spodziewać dość szybkiego zakończenia sporu na temat wieku poszczególnych haplogrup, łącznie z tymi najstarszymi (choć w tym przypadku brakuje nam jeszcze także wyników sekwencjonowania fragmentów Y-DNA znacznie dłuższych niż te 180-240 kB z pracy Mendeza, choć spodziewam się, że niedługo pojawi się jakaś praca, która uzupełni tę lukę i znacznie zwiększy istotność statystyczną otrzymanych szacunków).

Atim wrote:Dlatego, poniewaz zauważyłem, że Yfull zbiera zasadniczo wszystkie wyniki opublikowane (czyli jakoś zweryfikowane, choć nie wszystkie przez siebie) i dodaje je (słowo "miesza" jest tu chyba nieodpowiednie), tę sumę wszystkich zweryfikowanych wyników też mogę uznać za podstawą uśrednienia, dokładniejszą niż wyniki jednego autora, dysponującego jednym wycinkiem DNA.

To jest niestety Twój bardzo poważny błąd, o czym piszę powyżej. Dodając wszystkie mutacje wykrywane przez Y Elite (FGC) tylko do starszych poziomów filogenetycznych, a często jeszcze rezygnując z dodawania prywatnych mutacji reprezentujących najniższe poziomy, całkowicie zniekształcasz proporcje między poszczególnymi poziomami filogenetycznymi, co prowadzi głównie do znaczącego zaniżenia wieku wszystkich młodszych kladów (a jest to tylko jeden z wielu problemów wywołanych stosowaniem takiego podejścia).

Posts: 587
Joined: Thu Mar 15, 2012 11:59 am

YDNA:
Adam-L74; R1a-YP4700
MtDNA:
H14a
PostPosted: Fri Nov 14, 2014 7:57 am
Image

http://www.tropie.tarnow.opoka.org.pl/hg_czas.pdf

"Dyskutując, unika się zaimików i czasowników w drugiej osobie, by dyskusja była rzeczowa, a nie interpersonalna"
(kiedyś jakiś Stanisław do A.Klosowa na forum Rodstvo.ru)
Last edited by Atim on Mon Dec 08, 2014 3:15 pm, edited 1 time in total.

Posts: 587
Joined: Thu Mar 15, 2012 11:59 am

YDNA:
Adam-L74; R1a-YP4700
MtDNA:
H14a
PostPosted: Fri Nov 14, 2014 8:39 am
Michał wrote:
Atim wrote: Najpierw chcę podkreslić, że nie chodzi mi o moje racje i nie mam ochoty pisać przeciw cudzym racjom. Nigdy nie mam zamiaru trzymać się swojego zdania dlatego że jest moje. Szukam tylko prawdy naukowej. I dlatego, ku swojemu zmartwieniu, zbyt wiele razy zmieniam to, co napisałem, dostając jakies nowe dane (np. te nieszczęsne eksperymenty z drzewem filogemnetycznym; zawsze jednak sygnalizują, jaka jest ich podstawa!).
.....Chodzi o to, że Twój sposób obliczania TMRCA jest zupełnie nielogiczny, bo obliczając np. średnią liczbę mutacji dla danego kladu lub haplogrupy nie stosujesz tych samych kryteriów dla każdego poziomu filogenetycznego, sumując np. wszystkie znane mutacje z poziomu R1a+R1a1 (czyli w zasadzie te wykrywane testem Y Elite), ale dodając tylko część znanych mutacji z niższych poziomów (korzystając głównie z wyników Big Y) oraz ignorując często istnienie mutacji z najniższych poziomów (czyli prywatnych)....

Nieprawda. "Tak krawiec kraje, jak materii staje". Yfull nie daje dostępu do liczby mutacji prywatnych (a mógłby!), natomiast BigY nie daje rozliczenia z mutacji powyżej np. M417 (a mógłby!). Dlatego używałem rozwiazań rozmaitych, ze znanymi defektami.
Teraz w tabeli powyżej, korzystając z drzewa Yfull, doliczyłem na dole, pod R-Z280, dane z BigY, odpowiednio je dopasowując, najpierw do zakresu testowania i wyników FGC (40%) a potem uzupełniając o obliczony procent snipów innych ważnych publikowanych testowań, niezweryfikowanych przez zakres testowania w FGC, ale słusznie uwzględnionych przez Yfull (32%) .

Atim wrote: Uśredniłem uśrednione R1a=155 SNP i uśrednione R1b=127 i dało mi 141 SNP.
Tak jak napisałem uprzednio, ani 155 ani 127 nie oznaczają liczby "wszystkich" mutacji w liniach R1a i R1b (nie mówiąc już o tym, że nie są to liczby odpowiadające porównywalnym poziomom filogenetycznym), więc w ten sposób po raz pierwszy znacząco zaniżyłeś liczbę mutacji poniżej poziomu R1.
155 i 127 to liczba SNP uzyskana przez Raghavana i służaca do budowy drzewa

Atim wrote: Czas 24.000 lat przez Raghavana był liczony po upływie 35 prywatnych SNP w MA-1. Czyli R* będzie starszy o czas tych 35 SNP ponad 24.000 lat. Oznacza to też, że gdyby R* powstał 24.000 lat temu, miałby 35 SNP mniej, czyli 145 SNP.
To jest kolejny kardynalny błąd. Nie możesz porównywać tych 35 prywatnych mutacji np. z 35 mutacjami z poziomu R1 (albo ze 155 mutacjami poniżej poziomu R1 które są wspólne dla obu linii R1a), bo w pierwszym przypadku liczba ta obejmuje tylko mutacje zidentyfikowane w próbce aDNA, natomiast w pozostałych przypadkach liczby te dotyczą zarówno pozycji/mutacji zbadanych w aDNA, jak i takich, których nie udało się zbadać (czyli tych oznaczonych jako N).
Raghavan naprawdę nie starał się uzgodnić zakresów testowania?

Atim wrote:Ci autorzy, którzy posługują się ustalonymi przez siebie kryteriami, mają różne wyniki, m.in.dlatego, że mutacje nie miały żadnego kryterium i spacerowały po róznych odcinkach DNA, [b]koncentrując się to tu, to tam - w rozmaitych okresach czasu[/b].
Te autorskie wyniki nie bywają też zdolnie wznieść się wiele ponad 100 tysięcy dla np. A1; chyba rzadko mogą nawet osiągnąć wynik Crucianiego 142.000 lat, gdzie Mendez ma 209.000 lat.

Nie masz racji. Jeśli mówisz o różniących się wynikach otrzymywanych przez autorów poszczególnych publikacji lub też autorów niektórych w miarę wiarygodnych szacunków umieszczanych w internecie, to różniły się one głównie na skutek przyjęcia różnej wartości tempa mutacji, podczas gdy różnice wynikające z innych przyczyn były na ogół nieznaczące statystycznie.
Różnice okazują się nie tylko ze względu na szerokość zakresu testowania, ale i ze względu na zmienną liczbe mutacji w poszczególnych haplogrupach w odmiennych wybranych pasmach testowania. Snipy NRY/MSY nie mają zwyczaju równomiernie rozkładać sie po całym paśmie Y-DNA.

Atim wrote:Dlatego, poniewaz zauważyłem, że Yfull zbiera zasadniczo wszystkie wyniki opublikowane (czyli jakoś zweryfikowane, choć nie wszystkie przez siebie) i dodaje je (słowo "miesza" jest tu chyba nieodpowiednie), tę sumę wszystkich zweryfikowanych wyników też mogę uznać za podstawą uśrednienia, dokładniejszą niż wyniki jednego autora, dysponującego jednym wycinkiem DNA.
To jest niestety Twój bardzo poważny błąd, o czym piszę powyżej. Dodając wszystkie mutacje wykrywane przez Y Elite (FGC) tylko do starszych poziomów filogenetycznych, a często jeszcze rezygnując z dodawania prywatnych mutacji reprezentujących najniższe poziomy,...
Już wyżej wyjaśniłem. Korzystam z kalekich publikacji BigY i Yfull.
Co to znaczy "Dodając wszystkie mutacje wykrywane przez Y Elite (FGC) tylko do starszych poziomów filogenetyczny"? Po co takie opisanie? Nie stosuję arbitralnej wybiórczości. Uwzględniam wszystkie poziomy, mając tylko problem poniżej R-Z280, gdyż Yfull nie podaje liczby mutacji prywatnych.

Posts: 748
Joined: Thu Mar 15, 2012 10:08 am
Location: Warsaw, Poland
YDNA:
R1a-L1280
MtDNA:
H2a2
PostPosted: Fri Nov 14, 2014 2:26 pm
Atim wrote:"Dyskutując, unika się zaimików i czasowników w drugiej osobie, by dyskusja była rzeczowa, a nie interpersonalna"
(kiedyś jakiś Stanisław do A.Klosowa na forum Rodstvo.ru)

Postaram się więc odtąd unikać zwracania się w drugiej osobie (choć moim zdaniem utrudni to przekazywanie myśli, zwłaszcza w tej konkretnej dyskusji, dotyczącej bardzo "autorskiego" podejścia do zagadnienia).

Atim wrote:Nieprawda. "Tak krawiec kraje, jak materii staje".

Dobry krawiec z rozmysłem dobiera materiał, zarówno w odniesieniu do jakości surowca jak i odpowiedniego dopasowania poszczególnych elementów szytego ubrania (zamiast włączać każdą "szmatkę", nawet bardzo ładną, jaka mu wpadnie w ręce), zwłaszcza kiedy takie materiały są dostępne, trzeba je tylko umiejętnie selekcjonować.

Atim wrote:155 i 127 to liczba SNP uzyskana przez Raghavana i służaca do budowy drzewa

Raghavan nie budował w tej pracy drzewa, bo ogólny kształt tego drzewa był znany z wcześniejszej publikacji Wei i wsp. (na której się w tym względzie opierał). On tylko wykorzystał niektóre (ale nie wszystkie!) mutacje SNP z pracy Wei i wsp. do poprawnego umiejscowienia MA-1 w tymże drzewie (na podstawie wyników sekwencjonowania tej konkretnej próbki aDNA).

Atim wrote: Raghavan naprawdę nie starał się uzgodnić zakresów testowania?

Dysponując częściowo zdegradowanym materiałem aDNA, nie był po prostu w stanie zsekwencjonować całego obszaru Y-DNA, który był uprzednio objęty sekwencjonowaniem w przypadku współczesnych próbek badanych przez Wei i wsp.

Atim wrote:Różnice okazują się nie tylko ze względu na szerokość zakresu testowania, ale i ze względu na zmienną liczbe mutacji w poszczególnych haplogrupach w odmiennych wybranych pasmach testowania. Snipy nie mają zwyczaju równomiernie rozkładać sie po całym paśmie DNA.

Z tym się zgadzam, ale to jest właśnie jeszcze jedna dodatkowa wada omawianych tabelek, bo są one w zasadzie oparte na jednej konkretnej linii filogenetycznej (przynajmniej powyżej poziomu Z280).

Atim wrote:Co to znaczy "Dodając wszystkie mutacje wykrywane przez Y Elite (FGC) tylko do starszych poziomów filogenetyczny"? Po co takie opisanie? Nie stosuję arbitralnej wybiórczości. Uwzględniam wszystkie poziomy, mając tylko problem poniżej R-Z280, gdyż Yfull nie podaje liczby mutacji prywatnych.

W niemal wszystkich poprzednich "tabelkach TMRCA" po prostu nie uwzględniono faktu, że YFull nie zawsze jest w stanie przypisać wszystkie znane mutacje poniżej R1 odpowiednim poziomom filogenetycznym. Nie jest to wina YFull i należy zaznaczyć, że oni nigdy nie deklarowali, że podane przez nich liczby mutacji dla poszczególnych poziomów powinny być traktowane jako "reprezentatywne". Dla nich najważniejsza jest poprawność filogenetyczna rozumiana w sensie następstwa poszczególnych poziomów filogenetycznych i kolejności rozdzielania się poszczególnych kladów, natomiast sprawa dokładnej liczby mutacji odpowiadającej danemu poziomowi jest dla nich sprawą drugorzędną. (Niektórzy członkowie zespołu YFull deklarują zresztą nawet bardzo silny sceptycyzm co do możliwości wykorzystania mutacji SNP do obliczeń TMRCA, co moim zdaniem jest już lekką przesadą). Tak więc, o ile trudno coś zarzucić YFull w tej konkretnej kwestii (choć moim zdaniem ich drzewo ma kilka istotnych defektów wymagających modyfikacji), to ewidentnym błędem omawianych tabelek TMRCA było wykorzystanie tych danych w takiej właśnie "nieznormalizowanej" formie do obliczeń TMRCA. Trudno tłumaczyć to po prostu niewiedzą (albo raczej wyjątkowo silną wiarą w "reprezentatywność danych oferowanych przez drzewo YFull), bo dostępnych było jednocześnie mnóstwo dodatkowych informacji (zarówno w postaci wcześniejszych publikacji naukowych, jak i postów z wynikami FGC i Big Y, prezentowanych na różnych forach), które bardzo wyraźnie sugerowały, że "proporcje" między poszczególnymi poziomami filogenetycznymi są zupełnie inne.

Nie dysponuję niestety wszystkimi wcześniejszymi wersjami omawianych tabelek (bo autor zmodyfikował je niedawno w przynajmniej niektórych swoich starych postach), ale jako przykład posłużyć może chociażby ta tabelka sprzed dwóch miesięcy:

hg_time.jpg

Tabelka ta obejmuje np. 45 mutacji z poziomu R1-M173 przy jedynie 64 mutacjach z wszystkich pozostałych podpoziomów razem wziętych (w tym np. zaledwie 6 mutacji z poziomu R1a-M420 i zaledwie 4 mutacje z poziomu R1a1-M459). Wystarczy to porównać z danymi z ostatniej ("częściowo znormalizowanej") tabelki, gdzie liczba 45 mutacji z poziomu R1-M173 uległa tylko lekkiej modyfikacji (obniżeniu do 44), natomiast liczba wszystkich mutacji poniżej tego poziomu urosła aż do 300, obejmując przy tym aż 153 mutacje z sumowanych poziomów R1a-M420/R1a1-M459, błędnie opisanych zresztą jako R1a-M420 (ten błąd został co prawda powtórzony za YFull, ale autorowi zwrócono na niego uwagę już jakiś czas temu). Dla każdego powinno być więc oczywiste, że jeśli założymy, że najświeższa wersja tabelki jest znacznie bliższa prawdziwym "proporcjom liczbowym" między poszczególnymi poziomami filogenetycznymi (choć nadal można mieć co do tego mnóstwo zastrzeżeń), to poprzednia wersja była po prostu katastrofą (i odnosi się to także do innych, wcześniejszych wersji tabelek).

Atim wrote:
Teraz w tabeli powyżej, korzystając z drzewa Yfull, doliczyłem na dole, pod R-Z280, dane z BigY, odpowiednio je dopasowując, najpierw do zakresu testowania i wyników FGC (40%) a potem uzupełniając o obliczony procent snipów innych ważnych publikowanych testowań, niezweryfikowanych przez zakres testowania w FGC, ale słusznie uwzględnionych przez Yfull (32%) .

Nie wiem z czego wynikają te liczby 40% i 32% (moim zdaniem nie mają logicznego uzasadnienia), choć efekt jest (chyba niestety przypadkowo) poprawny. Zamierzony efekt można było osiągnąć na przynajmniej dwa sposoby. W pierwszym z nich można było wykorzystać fakt, że Big Y wykrywa średnio ok. 60% mutacji wykrywanych przez FGC. Liczbę mutacji wykrywanych przez Big Y (np. 34 mutacje poniżej Z280) należało więc podzielić przez 0,6 (albo pomnożyć przez 1,67), co w przypadku Z280 dałoby 57 (a dokładniej 56,7). Drugi sposób (nieco lepszy) wykorzystywałby konkretne dane z testów FGC, chociażby te analizowane przeze mnie już jakiś czas temu na tym forum:
viewtopic.php?f=77&t=1300&start=60
Od średniej liczby 64 mutacji poniżej Z645 należałoby odjąć 2 mutacje z poziomu Z283, 1 mutację z poziomu Z282 i 3 mutacje z poziomu Z280, co dałoby średnią liczbę 58 mutacji poniżej Z280. Obliczona w ten sposób wartość 58 jest (o dziwo) identyczna z tą widniejącą w najnowszej wersji tabeli, ale nie wiem, dlaczego do jej obliczenia użyto liczb 40% i 32%.

Najnowsza wersja tabeli ma wciąż sporo błędów, z których jeden wymieniłem powyżej (chodzi o mylenie poziomu R1a-M420 z "połączonymi" poziomami R1a-M420 i R1a1-M459).

Druga poważna wada to "powielenie" błędu YFull polegającego na przypisaniu ok. 90 znanych mutacji poniżej R1 poziomowi R1a-M420 (czy też łączonemu poziomowi R1a+R1a1), podczas gdy tak na prawdę nie wiadomo, któremu z czterech konkretnych poziomów one odpowiadają (w grę wchodzą poziomy R1a, R1a1, R1a1a i R1a1a1). Da się to rozstrzygnąć dopiero wtedy, gdy będziemy dysponowali wynikami FGC dla R1a*, R1a1* i R1a1a*.

Trzecia istotna wada tej tabeli jest też niestety konsekwencją błędnej (moim zdaniem) decyzji YFull o wyodrębnieniu poziomu R-Y482 dla zaznaczenia pozycji filogenetycznej chłopca z Malty. Ponieważ nie wszystkie mutacje SNP z poziomu R mogły być zbadane w tej konkretnej próbce, skutkowało to najprawdopodobniej "wyrzuceniem" z drzewa ok. 30 mutacji z dawnego poziomu R-M207, których nie udało się przypisać ani poziomowi R-Y482 ani "okrojonemu" poziomowi R-M207. Najgorsze jest to, że tych mutacji nie da się pewnie nigdy przypisać konkretnemu podpoziomowi, bo linia chłopca z Malty już wymarła, więc nie ma na kim tego sprawdzić. Dlatego też uważam, że żadne "pełne drzewo" (czyli zawierające wszystkie znane mutacje SNP) nie może zawierać gałęzi wymarłych, których nie da się do końca przetestować.

Czwarta wada tabeli (i zawartych w niej szacunków TMRCA) wiąże się z brakiem wystarczających danych na temat "pełnej" listy mutacji odpowiadających wyższym poziomom filogenetycznym (zwłaszcza w okolicach, A, A0 i A00, ale nie tylko tam), co praktycznie skutkuje zupełnym brakiem wiarygodności jeśli chodzi o datowanie stosunkowo wczesnych etapów rozwoju tego drzewa filogenetycznego. Przykładowo, ostatnia wersja tabelki sugeruje, że linia K-M256 wyodrębniła się dopiero ok. 43,9 tys. lat temu (na lądzie sundajskim), podczas gdy syberyjskie szczątki z Ust'-Ishim, datowane radiowęglowo na 46 tys. lat temu należały już do jednego z wymarłych subkladów K-M256.

Piąta wada odnosi się do kalibracji tempa mutacji w oparciu o błędne obliczenie wieku R* na podstawie danych z Malty (co opisałem szczegółowo w moim poprzednim poście). Dzięki szczęśliwemu zbiegowi okoliczności, polegającemu na tym, że zarówno wiek, jak i liczba mutacji w tabelce, zostały zaniżone, sugerowana w tabeli liczba lat na mutację (w odniesieniu do testu FGC lub innego testu o podobnie dużym zakresie) nie odbiega zapewne zbyt bardzo od rzeczywistej wartości, ale mimo wszystko tabelka ta wprowadza ludzi w błąd (jeśli chodzi o wiek haplogrupy R).

Szósta wada jest na szczęście wzmiankowana w opisie tabeli w kontekście ewentualnej przyszłej korekty (chodzi o oparcie szacunków na średnich wartościach dla kilku różnych linii), ale trudno będzie to chyba zrobić zachowując obecną formę tabeli.

Posts: 587
Joined: Thu Mar 15, 2012 11:59 am

YDNA:
Adam-L74; R1a-YP4700
MtDNA:
H14a
PostPosted: Fri Nov 14, 2014 4:49 pm
Na tabeli czerwonymi literami piszę "eksperymentalna".
Jest to eksperyment wykonany na konkretnym już publikowanym materiale. Nie z winy Tabeli jest on taki, jaki jest. Sam jednak eksperyment ma sój sens, gdyż ukazuje testowanym klientom miejsce w całości rodu, nadto uwidacznia, na przykład zespołwowi Full, niedostatki, które są do poprawy lub uzupełnienia. Wiem, że niektóre niedostatki (np. połączenie pięter snipów) są spowodowane brakiem testowania unikalnych gałezi bocznych, kóre mogą rodzielić wieksze zespoły snipów. Ale to na naszym drzewie wystepuje od początku - na przestrzeni pomiędzy R1a a R1a1a. Ktoś tam raz kogoś w Iranie czy Pakistanie złapał i potestował (17 STR), oficjały ten fakt uznali, i problem sie zaczął...

" W niemal wszystkich poprzednich "tabelkach TMRCA" po prostu nie uwględniono faktu, że YFull nie zawsze jest w stanie przypisać wszystkie znane mutacje poniżej R1 odpowiednim poziomom filogenetycznym. "
No właśnie... Wyjaśnienie jak wyżej!

"Tak więc, o ile trudno coś zarzucić YFull w tej konkretnej kwestii "
A po co wo ogóle - zarzucać?

"Tabelka ta [sprzed dwóch miesiecy] obejmuje np. 45 mutacji z poziomu R1-M173 przy jedynie 64 mutacjach z wszystkich pozostałych podpoziomów razem wziętych (w tym np. zaledwie 6 mutacji z poziomu R1a-M420 i zaledwie 4 mutacje z poziomu R1a1-M459). Wystarczy to porównać z danymi z ostatniej ("częściowo znormalizowanej") tabelki, gdzie liczba 45 mutacji z poziomu R1-M173 uległa tylko lekkiej modyfikacji (obniżeniu do 44), natomiast liczba wszystkich mutacji poniżej tego poziomu urosła aż do 300... "
Ta stara tabelka prawdopodobnie zasygnalizowała zespołowi Yfull potrzebę podawania liczby snipów (trudno czytelnych na wykonanym drzewie) i przy okazji odpowiedniego ich uzupelnienia. Ktos tam zauważył to szczególne zapotrzebowanie w rodzie R1a i wykonał.

"Nie wiem z czego wynikają te liczby 40% i 32% (moim zdaniem nie mają logicznego uzasadnienia), choć efekt jest (chyba niestety przypadkowo) poprawny. "
40% jest to właśnie wielokrotnie stwierdzona przewaga liczebna snipów w testowaniu FGC.
32% to średnia powstała po zsumowaniu Snipów niezweryfikowanych przez zakres testowania FGC w większych grupach. Otrzymałem 319 niezweryfikowanych na 1013 wszystkich. Proporcje w poszczególnych grupach snipów sa porównywalne. Za wyjatkiem np. R1a1a1-M417, gdzie wszystkie SNP są zweryfikowane. Ale przeliczałem większe grupy raczej te powyżej.

"Najnowsza wersja tabeli ma wciąż sporo błędów, z których jeden wymieniłem powyżej (chodzi o mylenie poziomu R1a-M420 z "połączonymi" poziomami R1a-M420 i R1a1-M459) ."
To może nie jest błąd tabeli, tylko braki w jej publikowanej podstawie: drzewa Yfull.

"Druga poważna wada to "powielenie" błędu YFull polegającego na przypisaniu ok. znanych 90 mutacji poniżej R1 poziomowi R1a-M420 (czy też łączonemu poziomowi R1a+R1a1), podczas gdy tak na prawdę nie wiadomo, któremu z czterech konkretnych poziomów one odpowiadają (w grę wchodzą poziomy R1a, R1a1, R1a1a i R1a1a1). Da się to rozstrzygnąć dopiero wtedy, gdy będziemy dysponowali wynikami FGC dla R1a*, R1a1* i R1a1a*. "
Wyjaśnienie jak wyżej.

"Trzecia istotna wada tej tabeli jest też niestety konsekwencją błędnej (moim zdaniem) decyzji YFull o wyodrębnieniu poziomu R-Y482 dla zaznaczenia pozycji filogenetycznej chłopca z Malty. Ponieważ nie wszystkie mutacje SNP z poziomu R mogły być zbadane w tej konkretnej próbce, skutkowało to najprawdopodobniej "wyrzuceniem" z drzewa ok. 30 mutacji z dawnego poziomu R-M207, których nie udało się przypisać ani poziomowi R-Y482 ani "okrojonemu" poziomowi R-M207 ."
Poziom R* utracił na tej kastracji tylko może cztery snipy, te dla grupy Y-482.

"Najgorsze jest to, że tych mutacji nie da się pewnie nigdy przypisać konkretnemu podpoziomowi, bo linia chłopca z Malty już wymarła, więc nie ma na kim tego sprawdzić. Dlatego też uważam, że żadne "pełne drzewo" (czyli zawierające wszystkie znane mutacje SNP) nie może zawierać gałęzi wymarłych, których nie da się do końca przetestować ."
Całość drzewa na tym nie ucierpiała.
Jest to linia boczna w stosunku do wyodrębnionego pnia. Ona zaistniała i została zlokalizowana.
Autorzy drzewa nie podają liczby i nazw mutcji. Drzewo Yfull też jest tylko eksperymentalne. Jednak jest chyba nieco lepsze od ISOGG.

"Czwarta wada tabeli (i zawartych w niej szacunków TMRCA) wiąże się z brakiem wystarczających danych na temat "pełnej" listy mutacji odpowiadających wyższym poziomom filogenetycznym (zwłaszcza w okolicach, A, A0 i A00, ale nie tylko tam), co praktycznie skutkuje zupełnym brakiem wiarygodności jeśli chodzi o datowanie stosunkowo wczesnych etapów rozwoju tego drzewa filogenetycznego ."
Ale na co to narzekanie? To własnie tabela sygnalizuje, bo ludzie się o te szczegóły swojej genealogii pytają.
Wiem, że niekórzy administratorzy projektów starają się o uzupełnienie najważniejszych luk. Lecz niekiedy dotyczą one testowania ludzi w głebokiej Afryki lub Azji.
Ostatnio, znając moją słabość, znów mnie w dwóch przypadkach proszono o rozprucie zaszytej kieszeni... No i musiałem to zrobić...

"Przykładowo, ostatnia wersja tabelki sugeruje, że linia K-M256 wyodrębniła się dopiero ok. 43,9 tys. lat temu (na lądzie sundajskim), podczas gdy syberyjskie szczątki z Ust'-Ishim, datowane radiowęglowo na 46 tys. lat temu należały już do jednego z wymarłych subkladów K-M256." Jedno i drugie jest zarazem mozliwe. K jest bardzo bogate w podgałęzi; a zwiazki większości z nich z Sundalandem są bezsporne.

" Piąta wada odnosi się do kalibracji tempa mutacji w oparciu o błędne obliczenie wieku R* na podstawie danych z Malty "
Chciałbym mieć dostęp do tekstu autorów w tym punkcie. Co to są te 35 SNP non-N? Co autorzy naten temat napisali?
Zmiana tabeli jest w każdej chwili możliwa. Dajcie mi tylko materiał. Upominałem sie już o jakąś statystykę R1b według Yfull. Sam przeliczałem kilka razy, ale wychodzą zwariowane wyniki z powodu nieznajomości liczby prywatnych.

Posts: 587
Joined: Thu Mar 15, 2012 11:59 am

YDNA:
Adam-L74; R1a-YP4700
MtDNA:
H14a
PostPosted: Fri Nov 14, 2014 4:56 pm
Na razie, przynajmniej jakiś czas, niech sobie pożyje ta tablica
Image

Czas rozwoju (wyłonienia i rozwidlenia) głównych haplogrup:
http://www.tropie.tarnow.opoka.org.pl/hg_czas.pdf
Last edited by Atim on Mon Dec 08, 2014 3:19 pm, edited 2 times in total.

Posts: 748
Joined: Thu Mar 15, 2012 10:08 am
Location: Warsaw, Poland
YDNA:
R1a-L1280
MtDNA:
H2a2
PostPosted: Sun Nov 16, 2014 3:22 pm
Atim wrote:Na tabeli czerwonymi literami piszę "eksperymentalna".

"Eksperymentalna" nie powinno oznaczać "nielogiczna", albo "ignorująca dostępną wiedzę na dany temat", a tak niestety było w tym przypadku.
Przypomnę chociażby, że już od roku wiadomo było, że FGC wykrywa ponad 300 mutacji w przeciętnej linii R1a (poniżej poziomu R1), więc tabelkę sugerującą, że tych mutacji jest tylko 64, trudno było potraktować inaczej niż jakiś niemądry żart. Poza tym autor tabelki nie żył przecież w próżni. Dostępnych było sporo publikacji i niemało danych na forach genealogicznych, a wszystko to było dość intensywnie dyskutowane (czasami zresztą z udziałem autora omawianej tabelki), przy czym dane te wyraźnie wskazywały, że założenia autora są więcej niż błędne.

Atim wrote:Jest to eksperyment wykonany na konkretnym już publikowanym materiale. Nie z winy Tabeli jest on taki, jaki jest.

Jak to nie z winy Tabeli? Tylko autor Tabeli jest odpowiedzialny za rozsądny dobór materiału do obliczeń oraz za jego prawidłową interpretację. Jeśli nie autor jest winny, to kto?

Powiem może inaczej: Gdyby ta tabelka prezentowała tylko liczby mutacji znanych dla poszczególnych poziomów filogenetycznych, nie byłoby to żadnym grzechem, nawet gdyby niektóre liczby nie odpowiadały dokładnie faktycznemu stanowi wiedzy (bo tego typu nieścisłości mogą się zawsze zdarzać). Jednak wykorzystanie takiego ewidentnie "niereprezentatywnego" materiału do sporządzania jakichkolwiek "wiarygodnych" obliczeń TMRCA, to już było po prostu rozmyślne wprowadzanie ludzi w błąd, bo autor musiał (albo przynajmniej powinien) być świadomy błędności swoich założeń (a niektórzy dali się niestety na to nabrać, sądząc po dyskusji prowadzonej chociażby na tym forum).
Każdy ma prawo do pomyłki, ale trzeba umieć się do własnego błędu przyznać i dokonać odpowiedniej korekty, zamiast trzymać się dalej tych nielogicznych założeń (albo usprawiedliwiać się "błędami" innych).

Atim wrote:"Tak więc, o ile trudno coś zarzucić YFull w tej konkretnej kwestii "
A po co wo ogóle - zarzucać?

No właśnie, po co? (patrz powyżej)

Atim wrote:Ta stara tabelka prawdopodobnie zasygnalizowała zespołowi Yfull potrzebę podawania liczby snipów (trudno czytelnych na wykonanym drzewie) i przy okazji odpowiedniego ich uzupelnienia. Ktos tam zauważył to szczególne zapotrzebowanie w rodzie R1a i wykonał.

Coś takiego można było załatwić w korespondencji z członkami zespołu YFull (nawet na forum publicznym). Na pewno nie uprawniało to nikogo do interpretowania ich danych w ewidentnie błędny sposób (i jeszcze dość długiego upierania się przy tej błędnej interpretacji).

Atim wrote:"Nie wiem z czego wynikają te liczby 40% i 32% (moim zdaniem nie mają logicznego uzasadnienia), choć efekt jest (chyba niestety przypadkowo) poprawny. "
40% jest to właśnie wielokrotnie stwierdzona przewaga liczebna snipów w testowaniu FGC.

To jest niestety poważny (w zasadzie "szkolny") błąd matematyczny. To, że Big Y wykrywa ok. 60% mutacji wykrywanych przez FGC nie oznacza, że liczba mutacji wykrywanych przez FGC jest o 40% większa od liczby mutacji wykrywanych przez Big Y. W takim przypadku należało raczej założyć, że liczba odpowiadająca FGC jest o 67% (40/60) większa od liczby odpowiadającej Big Y.

Atim wrote:32% to średnia powstała po zsumowaniu Snipów niezweryfikowanych przez zakres testowania FGC w większych grupach. Otrzymałem 319 niezweryfikowanych na 1013 wszystkich.

Przyznam się, że nadal nie rozumiem, czemu dokładnie odpowiada 32%. Z poprzednich wyjaśnień wynikało, że są to mutacje niewykrywane przez FGC, ale identyfikowane (w jakiś sposób) przez YFull, co wydaje się zupełnie nieprawdopodobne. Czy mógłbym prosić o przykłady takich mutacji "niezweryfikowanych" przez FGC (razem z przykładem mutacji zweryfikowanej przez FGC dla tego samego poziomu filogenetycznego)?

Atim wrote:"Najnowsza wersja tabeli ma wciąż sporo błędów, z których jeden wymieniłem powyżej (chodzi o mylenie poziomu R1a-M420 z "połączonymi" poziomami R1a-M420 i R1a1-M459) ."
To może nie jest błąd tabeli, tylko braki w jej publikowanej podstawie: drzewa Yfull.

Jak powyżej, to był ewidentny błąd w interpretacji drzewa. Trudno przecież było nie zauważyć braku poziomu R1a1-M459 w drzewie YFull. (Choć zgadzam się, że YFull nie jest w tym przypadku całkiem bez winy).

Atim wrote:"Druga poważna wada to "powielenie" błędu YFull polegającego na przypisaniu ok. znanych 90 mutacji poniżej R1 poziomowi R1a-M420 (czy też łączonemu poziomowi R1a+R1a1), podczas gdy tak na prawdę nie wiadomo, któremu z czterech konkretnych poziomów one odpowiadają (w grę wchodzą poziomy R1a, R1a1, R1a1a i R1a1a1). Da się to rozstrzygnąć dopiero wtedy, gdy będziemy dysponowali wynikami FGC dla R1a*, R1a1* i R1a1a*. "
Wyjaśnienie jak wyżej.

I moja odpowiedź jak wyżej.

Atim wrote:"Trzecia istotna wada tej tabeli jest też niestety konsekwencją błędnej (moim zdaniem) decyzji YFull o wyodrębnieniu poziomu R-Y482 dla zaznaczenia pozycji filogenetycznej chłopca z Malty. Ponieważ nie wszystkie mutacje SNP z poziomu R mogły być zbadane w tej konkretnej próbce, skutkowało to najprawdopodobniej "wyrzuceniem" z drzewa ok. 30 mutacji z dawnego poziomu R-M207, których nie udało się przypisać ani poziomowi R-Y482 ani "okrojonemu" poziomowi R-M207 ."
Poziom R* utracił na tej kastracji tylko może cztery snipy, te dla grupy Y-482.

Zupełnie nie rozumiem, jak można sugerować coś takiego po przeanalizowaniu drzewa z pracy Raghavana i po przeprowadzeniu ze mną tak długiej dyskusji na ten temat. (Naprawdę trudno zachować spokój czytając takie zupełnie nieprzemyślane odpowiedzi).

Proszę zauważyć, że "łączny" poziom R na drzewie Raghavana ma aż 41 mutacji (36+5), podczas gdy drzewo YFull oraz omawiana tabelka mają ich tylko 26 (22+4). Biorąc dodatkowo pod uwagę fakt, że drzewo Raghavana jest oparte na wynikach Wei i wsp., który sekwencjonował tylko stosunkowo nieduży region 8,97 Mb, możemy spokojnie założyć, że wszystkich mutacji testowanych przez FGC jest na tym poziomie ze dwa razy więcej (czyli pewnie ok. 70-90, jeśli nie więcej).

Atim wrote:"Najgorsze jest to, że tych mutacji nie da się pewnie nigdy przypisać konkretnemu podpoziomowi, bo linia chłopca z Malty już wymarła, więc nie ma na kim tego sprawdzić. Dlatego też uważam, że żadne "pełne drzewo" (czyli zawierające wszystkie znane mutacje SNP) nie może zawierać gałęzi wymarłych, których nie da się do końca przetestować ."
Całość drzewa na tym nie ucierpiała.
Jest to linia boczna w stosunku do wyodrębnionego pnia. Ona zaistniała i została zlokalizowana.

Kształt drzewa z pewnością nie ucierpiał, ale zdecydowanie ucierpiała reprezentatywność liczby mutacji odpowiadających poszczególnym poziomom filogenetycznym. Proszę przeczytać jeszcze raz (bardzo dokładnie), to co napisałem uprzednio (oraz moją odpowiedź umieszczoną tuż powyżej), i bardzo głęboko zastanowić się nad konsekwencją tego faktu dla ewentualnych obliczeń TMRCA na podstawie obecnego drzewa YFull.

Atim wrote:Wiem, że niekórzy administratorzy projektów starają się o uzupełnienie najważniejszych luk. Lecz niekiedy dotyczą one testowania ludzi w głebokiej Afryki lub Azji.
Ostatnio, znając moją słabość, znów mnie w dwóch przypadkach proszono o rozprucie zaszytej kieszeni... No i musiałem to zrobić...

Naprawdę to doceniam, i przyznam się szczerze, że była to jedna z głównych przyczyn, dla których w końcu zareagowałem na serię omawianych tabelek. Od osoby jako tako orientującej się w temacie wymaga się po prostu znacznie więcej niż od zupełnych nowicjuszy, zwłaszcza że fakt bycia pewnym autorytetem w kwestii tych wczesnych afrykańskich linii sprawia, że ludzie mają więcej zaufania do takich obliczeń, a tym samym dużo łatwiej wprowadzić ich w ten sposób w błąd.

Atim wrote:"Przykładowo, ostatnia wersja tabelki sugeruje, że linia K-M256 wyodrębniła się dopiero ok. 43,9 tys. lat temu (na lądzie sundajskim), podczas gdy syberyjskie szczątki z Ust'-Ishim, datowane radiowęglowo na 46 tys. lat temu należały już do jednego z wymarłych subkladów K-M256." Jedno i drugie jest zarazem mozliwe. K jest bardzo bogate w podgałęzi; a zwiazki większości z nich z Sundalandem są bezsporne.

Tu nie chodzi o to, że wcześni członkowie kladu K-M256 musieliby przewędrować z Sundalandu aż na Syberię (bo to jest nadal jak najbardziej możliwe, przynajmniej teoretycznie), tylko o to, że według tych niewiarygodnych obliczeń musieliby się podczas takiej długiej podróży cofnąć w czasie, a to jest już jednak gruba przesada.

Atim wrote:" Piąta wada odnosi się do kalibracji tempa mutacji w oparciu o błędne obliczenie wieku R* na podstawie danych z Malty "
Chciałbym mieć dostęp do tekstu autorów w tym punkcie. Co to są te 35 SNP non-N? Co autorzy naten temat napisali?

Czy mam przez to rozumieć, że prowadziłem tak długą dyskusję na temat drzewa Raghavana z kimś, kto nie przeczytał nawet legendy do tego drzewa? Cały rozdział poświęcony analizie Y-DNA u chłopca z Malty dostępny jest online (str. 45-50). Drzewo z legendą jest na str. 48:
http://www.nature.com/nature/journal/v5 ... 736-s1.pdf
Autorzy piszą między innymi: "The derived (d) or ancestral (a) states of called (non-N) sites in the MA-1 Y chromosome are noted on the edges of the tree.", z czego wynika, że symbol N oznacza te mutacje analizowane przez Wei i wsp., których nie udało się odczytać w próbce chłopca z Malty. Analiza całego drzewa sugeruje, że te "nieprzeczytane" (non-called, N) mutacje stanowią co najmniej połowę wszystkich mutacji z regionu analizowanego przez Wei i wsp. (czyli 8,97 Mb), tak więc jeśli każdej mutacji z innych gałęzi (analizowanych we współczesnych próbkach DNA) odpowiada ok. 159 lat, to każdej "prywatnej" mutacji znalezionej w wymarłej linii reprezentowanej przez aDNA chłopca z Malty odpowiada zapewne co najmniej 300 lat.

Atim wrote:Zmiana tabeli jest w każdej chwili możliwa. Dajcie mi tylko materiał. Upominałem sie już o jakąś statystykę R1b według Yfull.

Dopóki nie ma wyników FGC dla wszystkich kluczowych poziomów filogenetycznych (a pewnie nieprędko będą), to jedynym wyjściem dla tej tabelki jest podanie liczb wynikających z przeliczenia danych z różnych dotychczasowych publikacji, ale w takim przypadku dużo rozsądniej byłoby zrobić tabelkę porównującą po prostu dane z różnych publikacji (oraz te dostępne z Big Y i FGC) , zamiast przeliczać wszystkie te dane na przewidywane liczby odpowiadające testowi FGC.
Previous

Return to Język Polski

Who is online

Users browsing this forum: No registered users and 1 guest

cron