Почему очень полезно делать тесты ДНК в нескольких компаниях - 2

Опубликовано kom - чт, 22/08/2019 - 17:00

Пока суть да дело, продолжаю неспешно заниматься улучшайзингом своих китов от MyHeritage и FTDNA. Напомню, что в первой серии удалось добиться заметного успеха простой перезаливкой их в GEDMatch после перехода сайта на платформу Genesis (для дальнейшего сравнения эти киты приведены в первых двух колонках таблицы).
https://www.facebook.com/groups/169714816510441/permalink/1377319369083307/
В этот раз решил пойти немного дальше и изготовить "суперкит" объединением этих двух китов. Предполагалось, что такое объединение 1) увеличит количество SNP в объединенном ките (за счет включения несовпадающих SNP в каждом из двух объединяемых китов) и 2) уменьшит количество "no-calls", то есть неопределившихся SNP.
Попробовал два способа: онлайновый инструмент GEDMatch (третья колонка) и инструмент, включенный в состав последней версии DNA Kit Studio (четвертая колонка).
Из сравнения результатов, приведенных в третьей и четвертой колонке видно, что суперкиты получились практически идентичными. Во всяком случае они дают в точности одинаковое количество совпадений по всей базе GEDMatch.
Было также интересно сравнить, что изменилось в суперкитах по сравнению с исходниками.
Сравнение левой и правой частей таблицы показывает, что количество используемых SNP несильно, но выросло, как и предполагалось. Заметного изменения тут и не следовало ожидать, так как наборы SNP в MyHeritage и FTDNA практически идентичны, так что улучшение тут возможно в основном за счет уменьшения количества no-calls.
Общее количество совпадений также немного уменьшилось; так и должно было бы быть, если частично ушли ложные или сомнительные матчи. Однако ушли не до конца, что хорошо видно в нижней половине таблицы, где приведено количество совпадений лишь с одним из двух сравниваемых китов (можно предполагать, что такие совпадения - ложные). Это количество хотя и уменьшилось относительно предыдущих значений, но все же еще осталось ненулевым, особенно при учете более мелких фрагментов (самая нижняя часть таблицы; в центре - сравнение исходника от FTDNA и суперкита).
Подводя итог, можно сказать, что изготовление суперкита в любом случае улучшает качество, однако использование для такого изготовления китов компаний, работающих на практически идентичных чипах, сильного улучшения достичь не позволяет. Поэтому в дальнейших планах - изготовление суперкита с использованием кита от компании, сильно отличающейся по набору SNP от MyHeritage и FTDNA.